Этот проект представляет собой приложение для синтеза речи на основе PyQt5 и модели Silero TTS. Приложение позволяет вводить текст, выбирать диктора, генерировать аудиофайлы, проигрывать их и сохранять в формате WAV.
Перед запуском необходимо установить зависимости из requirements.txt
:
pip install -r requirements.txt
Дополнительно потребуется silero-models
:
torch.hub.load('snakers4/silero-models', 'silero_tts', language='ru', speaker='ru_v3')
- Запустите приложение:
python app.py
- Введите текст в текстовое поле.
- Выберите диктора из списка.
- Нажмите Create Audio для генерации аудиофайла.
- Используйте Play Audio для воспроизведения.
- Сохраните результат с помощью Save Audio.
main.py
— основной файл с кодом GUI и логикой работы.icon.py
— файл, содержащий иконку в виде base64-строки.requirements.txt
— список зависимостей.
- Отсутствует модель: убедитесь, что интернет-соединение активно при первом запуске.
- Нет звука при воспроизведении: проверьте устройство вывода звука в системе.
- Ошибка сохранения файла: убедитесь, что у вас есть права на запись в указанную директорию.
Этот проект распространяется по лицензии MIT.
Разработано для работы с русскоязычным TTS на базе Silero.