ShitTTS 是一个旨在简化文本转语音操作的工具集,包含图形界面 (GUI) 和命令行 (CLI) 两个版本。它基于 pyttsx3 库构建,能够直接调用系统自带的 TTS 引擎进行语音合成。
使用Pyinstaller打包
说明:
图标来源于Google Emoji Kitchen
这个项目就是个垃圾
别用
开发初衷:为了免去完成E听说模拟考试作业的麻烦,我找到了一款可以自动获取答案的工具,
如果能将答案文本转换为语音,又能够自动朗读答案,也无需自己开口那就好了。
但是那些TTS软件用起来也太麻烦了,直接调用系统的TTS也很麻烦!
所以我使用AI工具开发了这个项目,基于Pyttsx3实现TTS语音合成,
再借助Voicemeeter将音频输出到虚拟麦克风中,从而模拟人声完成作业。
免责声明:本项目仅供学习和参考,请根据实际需求选择更专业、功能更强大的 TTS 软件。
提供直观易用的图形用户界面,适合不熟悉命令行操作的用户。
主要特性:
- 可视化界面: 基于 Tkinter 构建,操作简便。
- 语音选择: 下拉菜单列出系统所有可用语音,并显示语音详情(名称、ID、语言、性别、年龄)。
- 参数调节: 可通过滑块实时调整语速 (50-300) 和音量 (0.0-1.0)。
- 文本输入: 支持直接在文本框内输入或通过按钮导入
.txt文本文件。 - 朗读模式:
- 朗读全文: 一次性朗读文本框内的所有内容。
- 分块朗读: 将文本按空行分割成多个块,支持逐块朗读、上一块/下一块切换、跳转到指定块。
- 后台朗读: 使用后台线程处理语音合成,避免界面卡顿。提供“停止”按钮中断当前朗读任务。
运行方式:
- 确保已安装所需依赖(如
pyttsx3,pyttsx3)。 - 运行
python ShitTTS-GUI.py启动图形界面。
提供功能丰富的命令行交互界面,适合需要脚本化操作或偏爱终端的用户。
主要特性:
- 交互式命令行: 通过简洁的命令前缀 (
:) 进行控制。 - 文件读取: 支持加载一个或多个
.txt文件,并按空行自动分块处理。 - 语音选择: 使用
:voices命令列出所有可用语音,通过:voice select <编号>进行选择。 - 参数设置: 使用
:rate和:volume命令调整语速和音量。 - 灵活朗读模式:
- 手动输入: 直接输入文本行按回车即可朗读。
- 文件分块: 加载文件后,程序进入分块浏览模式,可查看当前块、上/下一块摘要,按回车朗读当前块,使用
:back,:next,:goto <编号>导航。
- 配置持久化: 会自动保存语速、音量、最近打开的文件以及选定的语音 ID 到
config.json文件中。 - 便捷命令: 提供
:list(列出当前目录 txt 文件),:clear(清屏),:help(显示帮助),:about(显示项目信息) 等实用命令。
运行方式:
- 确保已安装所需依赖(如
pyttsx3)。 - 运行
python ShitTTS-CLI.py启动命令行交互程序。 - 根据屏幕提示输入命令或文本。
- 克隆或下载本项目代码。
- 安装 Python 3.x。
- 安装核心依赖库:
pip install pyttsx3
- 安装tkinter (GUI)
注意:根据你的操作系统和 Python 环境,可能还需要安装额外的系统依赖或驱动来支持特定的 TTS 引擎(例如,在 Linux 上可能需要
pip install tkinter
espeak或speech-dispatcher)。
Copyright © 2025 GTSense.
本项目采用 MIT 许可证授权。详见 LICENSE 文件。
