基于腾讯云ASR API实现的语音转文字工具,支持长音频自动分段处理。
- 🎙️ 支持常见音频格式转换(MP3/WAV等)
- ⚡ 实时语音识别(60秒内音频)
- 🔄 自动分块处理长音频
- 🔒 安全凭证管理(.env文件)
- Python 3.8+
- 腾讯云账号(获取SecretId/SecretKey)
- FFmpeg(音频处理依赖)
# 克隆仓库
git clone https://github.com/yourname/asr-tencent-project.git
# 安装依赖
pip install -r requirements.txt
# 配置环境变量
cp .env.sample .env
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
# 安装音频依赖
brew install portaudio # macOS
sudo apt-get install portaudio19-dev # Linux
创建 .env
文件:
TENCENT_SECRET_ID=your_secret_id
TENCENT_SECRET_KEY=your_secret_key
# 文件模式
python asr_app.py audio.wav
# 实时模式
python asr_app.py
选择模式2