這是一個預備用於線上會議即時翻譯的先期測試 Django 網頁小程式,旨在測試如何使用 speech_recognition
模組來實現語音辨識功能。本程式利用 Google 語音辨識 API(免費)來將語音轉換為文字,並在說話停頓後輸出辨識與翻譯結果。
- 持續監聽麥克風的語音。
- 語音辨識並在說話停頓後輸出辨識結果。
- 支援中文和整句英文的語音輸入。
在使用本程式之前,請確保已安裝以下 Python 模組:
django
speechrecognition
pyaudio
googletrans
threading
queue
time
你可以使用以下命令來安裝這些模組:
pip install django speechrecognition pyaudio googletrans threading queue time
或是直接安裝 requirements
pip install -r requirements.txt
在 macOS 系統上,你可能需要安裝一些前置元件。可以使用 port 或 brew 來安裝必要的依賴:
brew install portaudio
確保麥克風已正確連接並正常工作。 下載或克隆本專案。 在正確終端機環境中執行程式:
python manage.py runserver
程式會立即監聽麥克風並在終端機即時輸出辨識結果。
本程式主要設計用於中文語音的即時翻譯,但也能夠處理整句英文語音。語音辨識的準確性可能會受到環境噪音、麥克風質量和說話清晰度的影響。
- keoinn 的 人工智慧雲端系統實務-Django搭建網站
- NeuralNine 的 YouTube 教學影片
- Django Software Foundation -Django documentation
- speech_recognition 模組官方文檔
- Google 語音辨識 API 文檔
本專案使用 MIT 授權。