机器人语音交互代理系统(Voice Agent)
项目负责人 & 工程师
位军营
基本信息
担任角色
项目负责人 & 工程师
公司/背景
嵌入式机器人实时语音对话系统,部署为机器人本体语音交互中枢
开始时间
2025.08
结束时间
至今
项目描述
基于 C++17 开发嵌入式机器人实时语音对话系统
通过 WebSocket TLS 流式对接云端端到端大语言模型
并集成本地 ASR
TTS
意图识别服务
向外提供手机 App 控制接口
实现云端智能与本地控制双模式切换。负责事件驱动与 FSM 架构
状态机
技术栈
C++17
WebSocket
TLS
ALSA
Opus
MP3
FSM
事件驱动架构
GTCRN
VAD
亮点
系统拆分为音频
唤醒词
网络
机器人控制
服务
公共模块等 6 大核心模块
设计 8 状态白名单跳转表状态机
支持物理
虚拟麦克风与云端
本地控制源的 4 种运行模式
项目在多款机器人中作为标配功能