语音 AI 桌面助手 · 按住空格说话,松开发送
YCode.Vox 是一款面向桌面端的语音 AI 会话应用。按住空格键录音、松开发送,即可与 AI 进行语音对话,回复由微软 Edge TTS 语音合成播报。无需下载模型、无需配置本地推理,启动即可用。
- 按住空格说话 — 录音松开发送,支持中英混合识别
- 多智能体系统 — 内置3个专业智能体,支持自定义创建
- 灵活供应商配置 — 支持OpenAI、Claude、国产大模型等多种AI服务
- 独立对话记忆 — 每个智能体拥有独立的对话历史
- 提示词定制 — 完全自定义智能体的角色、能力和行为
- MCP & Skills — 支持外部工具连接和专业技能模块
- Edge TTS — 免费微软语音合成,声音自然、启动秒级、无需本地模型
- Electron 桌面应用 — 跨平台可安装(Linux / Windows / macOS)
语音优先的交互方式:无需频繁切换输入法,双手可继续操作键盘,用说话完成提问与回复。适合在编码、阅读文档时快速与 AI 对话,保持专注与流畅。
| 层级 | 技术 |
|---|---|
| 桌面壳 | Electron |
| 前端 | React 18 + TypeScript + Vite |
| AI | LangChain.js + OpenAI 兼容 API |
| TTS | msedge-tts(微软 Edge 在线语音合成) |
环境:Node.js 18+,Edge TTS 需联网。
git clone https://github.com/lyq-lin/YCode.Vox.git
cd YCode.Vox
npm install
npm run dev首次使用需在设置中配置 AI 供应商和选择智能体。详细使用指南请查看 智能体系统文档。
npm run build # 构建前端 + Electron
npm run dist # 生成安装包产物在 release/。支持 AppImage / deb (Linux)、nsis (Windows)、dmg (macOS)。
| 变量 | 说明 | 默认值 |
|---|---|---|
TTS_PORT |
内嵌 TTS 服务端口 | 8000 |
v0.2.0 引入了完整的智能体管理系统:
- 美式口音智能体 🇺🇸 — 专注英语学习和美式表达
- 通用Work智能体 💼 — 全能工作助手,日常办公必备
- 编码智能体 👨💻 — 专业编程助手,代码问题专家
- ✅ 智能体创建、编辑、删除
- ✅ 自定义系统提示词
- ✅ 独立的TTS语音配置
- ✅ MCP (Model Context Protocol) 支持
- ✅ Skills 技能模块系统
- ✅ 对话记忆自动保存
- ✅ 供应商与智能体分离配置
- ✅ 支持OpenAI、Claude、DeepSeek、智谱AI等多种供应商
详细文档请查看 AGENT_SYSTEM.md