AI-Girlfriend (你的女孩)

一个基于 Qt 6 QML 开发的 AI 虚拟伴侣桌面应用程序，集成了语音识别 (ASR)、大语言模型 (LLM) 和语音合成 (TTS) 功能，支持文字聊天和语音对话两种交互模式。

功能特性

核心功能

文字聊天: 与 AI 进行文字对话，支持实时响应
语音对话: 支持语音输入，AI 语音回复，实现真正的语音交互体验
语音克隆: 支持自定义 TTS 语音样本，可克隆任意声音
对话历史: 自动保存对话记录，支持多会话管理
上下文记忆: 同一对话中 AI 能够记住之前的对话内容，实现连贯的长对话
个性化定制: 可自定义 AI 角色名称、性格、系统提示词等

语音识别 (ASR)

基于 FunASR 的实时语音识别
支持 2pass 模式（在线+离线），兼顾实时性和准确性
实时显示语音转写结果
支持音频文件识别（用于语音样本参考文本自动生成）

语音合成 (TTS)

基于 CosyVoice 的零样本语音克隆
内置多个预设语音样本
支持自定义语音样本上传
自动识别语音样本的参考文本

服务状态监控

实时监控 Ollama、FunASR、CosyVoice 服务状态
自动重连机制，确保 WebSocket 连接稳定性
可视化服务状态面板

界面特性

现代化 UI 设计，简洁美观
响应式布局，自适应窗口大小
平滑动画效果，提升用户体验
侧边栏历史对话管理

技术架构

前端

Qt 6.8+ - 跨平台 GUI 框架
QML - 声明式 UI 开发
Qt Quick Controls 2 - 现代化控件库

后端服务

Ollama - 本地大语言模型服务 (默认端口: 11434)
- 支持 Qwen3、Llama3 等多种模型
- 支持对话历史上下文传递
FunASR - 阿里开源语音识别服务 (默认端口: 10096)
- 支持 2pass 实时+离线双模式
- WebSocket 实时流式传输
CosyVoice - 语音合成/克隆服务 (默认端口: 50000)
- 零样本语音克隆技术
- 支持自定义参考音频

通信协议

WebSocket - ASR 实时语音流传输
HTTP REST API - LLM 和 TTS 服务调用

项目结构

AI-Girlfriend/
├── main.cpp              # 应用程序入口
├── Main.qml              # 主界面
├── application.cpp/h     # 应用程序核心逻辑
│                         # - 对话历史管理
│                         # - 服务状态检测
│                         # - 音频文件识别
├── audiomgr.cpp/h        # 音频管理
│                         # - 麦克风录音
│                         # - TTS 音频播放
├── configmgr.cpp/h       # 配置管理 (单例模式)
│                         # - 用户/AI 角色设置
│                         # - 服务器地址配置
│                         # - 语音样本管理
├── gateway.cpp/h         # 网络通信网关
│                         # - WebSocket ASR 连接
│                         # - HTTP LLM/TTS 请求
│                         # - 自动重连机制
├── CMakeLists.txt        # CMake 构建配置
├── res.qrc               # Qt 资源文件
├── Components/           # QML 组件
│   ├── ChatMessageListModel.qml  # 聊天消息模型
│   ├── HistoryListModel.qml      # 历史对话模型
│   ├── MessageBubble.qml         # 消息气泡组件
│   └── SideButton.qml            # 侧边栏按钮
├── Pages/                # QML 页面
│   ├── ChatPage.qml      # 文字聊天页面
│   ├── VoiceChatPage.qml # 语音对话页面
│   ├── SettingPage.qml   # 设置页面
│   └── StatePage.qml     # 服务状态页面
├── js/                   # JavaScript 工具函数
│   └── addListModel.js
├── img/icon/             # 图标资源
└── sample/               # 语音样本文件
    ├── huiyuanai.WAV     # 灰原哀样本1
    ├── huiyuanai2.WAV    # 灰原哀样本2
    └── xuan.wav          # 默认样本

环境要求

开发环境

Qt 6.8 或更高版本
CMake 3.16+
MSVC 2022 (Windows) 或 GCC/Clang (Linux/macOS)

运行时依赖

Ollama - 本地 LLM 服务
FunASR - WebSocket 语音识别服务
CosyVoice - HTTP 语音合成服务

构建说明

Windows (MSVC)

# 创建构建目录
mkdir build
cd build

# 配置项目 (确保 Qt 在 PATH 中)
cmake .. -G "Ninja" -DCMAKE_PREFIX_PATH="C:/Qt/6.10.0/msvc2022_64"

# 编译
cmake --build .

使用 Qt Creator

打开 CMakeLists.txt 作为项目文件
选择合适的 Qt Kit (Qt 6.8+ MSVC 2022 64-bit)
点击构建并运行

配置说明

默认配置

配置项	默认值
用户名称	用户
AI 名称	雅萱
ASR 服务地址	ws://127.0.0.1:10096
LLM 服务地址	http://127.0.0.1:11434/api/chat
TTS 服务地址	http://127.0.0.1:50000/inference_zero_shot
LLM 模型	qwen3:8b

自定义配置

所有配置项均可在应用程序的"个性化定制"页面中修改，包括：

用户信息: 用户名称、用户描述
AI 角色: AI 名称、性格描述、系统提示词
服务器配置: ASR/LLM/TTS 服务地址、模型名称
语音克隆: 预设语音样本选择、自定义语音样本上传

后端服务部署

Ollama

# 安装 Ollama
# Windows: 从 https://ollama.ai 下载安装程序

# 下载并运行模型
ollama run qwen3:8b

FunASR

# 使用 Docker 部署
docker run -d \
  --name funasr \
  -p 10096:10096 \
  registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.10

# 或参考官方文档: https://github.com/alibaba-damo-academy/FunASR

CosyVoice

# 参考 CosyVoice 官方仓库部署
# https://github.com/FunAudioLLM/CosyVoice

# 启动推理服务，确保监听端口 50000
python webui.py --port 50000

使用说明

启动后端服务: 确保 Ollama、FunASR、CosyVoice 服务已启动
运行应用程序: 启动 AI-Girlfriend 应用
检查服务状态: 在"服务器状态"页面确认所有服务在线
开始对话:
- 文字聊天: 在首页输入框中输入文字，按回车或点击发送
- 语音对话: 点击侧边栏"语音对话"，点击麦克风按钮开始说话
个性化设置: 在"个性化定制"页面自定义 AI 角色和语音

使用技巧

上下文记忆: 在同一对话中，AI 会记住之前的对话内容。例如告诉 AI "我叫小明"，之后 AI 会记住你的名字
新建对话: 点击顶部"+"按钮创建新对话，清空上下文重新开始
历史对话: 在侧边栏可以查看和切换历史对话
语音克隆: 在设置页面上传自己的语音样本，AI 就能用你的声音说话

开发者信息

组织: BeyondESH
域名: beyondesh.top
应用名称: 你的女孩

许可证

本项目仅供学习和研究使用，无开发者本人许可禁止商用

更新日志

v0.2 (2025-12-8)

新增: 对话上下文记忆功能，AI 能记住同一对话中的历史内容
新增: 音频文件识别功能，支持自动生成语音样本的参考文本
新增: 自定义语音样本管理，独立存储样本路径、名称和参考文本
优化: ASR 使用 2pass 模式，提升识别准确性
优化: WebSocket 连接使用 127.0.0.1 替代 localhost，解决 IPv6 兼容性问题
优化: 语音对话页面独立会话，不与文字聊天历史混淆
修复: 修复文字聊天消息重复显示问题
修复: 修复语音样本切换不生效问题
修复: 修复空语音输入导致的异常 LLM 请求

v0.1 (初始版本)

实现文字聊天功能
实现语音对话功能
支持语音克隆
添加服务状态监控
添加个性化设置功能

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
.github/agents		.github/agents
.qtcreator		.qtcreator
Components		Components
Pages		Pages
img/icon		img/icon
js		js
python		python
sample		sample
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
Main.qml		Main.qml
README.md		README.md
application.cpp		application.cpp
application.h		application.h
audiomgr.cpp		audiomgr.cpp
audiomgr.h		audiomgr.h
configmgr.cpp		configmgr.cpp
configmgr.h		configmgr.h
gateway.cpp		gateway.cpp
gateway.h		gateway.h
main.cpp		main.cpp
res.qrc		res.qrc

Folders and files

Latest commit

History

Repository files navigation

AI-Girlfriend (你的女孩)

功能特性

核心功能

语音识别 (ASR)

语音合成 (TTS)

服务状态监控

界面特性

技术架构

前端

后端服务

通信协议

项目结构

环境要求

开发环境

运行时依赖

构建说明

Windows (MSVC)

使用 Qt Creator

配置说明

默认配置

自定义配置

后端服务部署

Ollama

FunASR

CosyVoice

使用说明

使用技巧

开发者信息

许可证

更新日志

v0.2 (2025-12-8)

v0.1 (初始版本)

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages