Skip to content

prod-broke-again/yandex-scpeechkit-python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Speech Recognition with Yandex SpeechKit

Этот проект предоставляет скрипт для распознавания речи из аудиофайлов с использованием Яндекс SpeechKit.

Требования

  • Python 3.9 или выше
  • Установленный ffmpeg для обработки аудиофайлов
  • Действительный API-ключ Яндекс SpeechKit

Установка

  1. Клонируйте репозиторий или скопируйте скрипт:

    git clone https://github.com/Laravelka/yandex-scpeechkit-python.git
    cd /frappe
  2. Установите необходимые зависимости:

    Убедитесь, что у вас установлен pip, и выполните команду:

    pip install yandex-speechkit
  3. Установите ffmpeg:

    • Скачайте ffmpeg с официального сайта.
    • Распакуйте архив в удобное место, например, C:\ffmpeg.
    • Добавьте путь к ffmpeg в переменные окружения PATH:
      • Откройте "Панель управления" -> "Система и безопасность" -> "Система".
      • Нажмите "Дополнительные параметры системы".
      • В разделе "Переменные среды" найдите переменную Path и добавьте путь к папке bin внутри директории ffmpeg, например, C:\ffmpeg\bin.

Настройка

  1. Получите API-ключ Яндекс SpeechKit:

    • Перейдите в Яндекс.Облако.
    • Создайте новый проект, если у вас его еще нет.
    • Перейдите в раздел "Управление доступом" и создайте сервисный аккаунт.
    • Создайте API-ключ для этого аккаунта.
  2. Настройте скрипт:

    • Откройте файл speech_recognition.py.
    • Замените API_KEY на ваш действительный API-ключ.

Использование

  1. Запустите скрипт:

    Убедитесь, что у вас есть аудиофайл в поддерживаемом формате (например, WAV), и выполните команду:

    • Для вывода результата в консоль:

      python speech_recognition.py --audio path/to/your/audio/bobik.wav
    • Для сохранения результата в файл:

      python speech_recognition.py --audio path/to/your/audio/bobik.wav --output path/to/save/result.txt
  2. Просмотрите результаты:

    • Если указан параметр --output, распознанный текст будет сохранен в указанный файл.
    • Если параметр --output не указан, распознанный текст будет выведен в консоль.

Примечания

  • Убедитесь, что ваш аудиофайл в формате, поддерживаемом API, и что вы используете правильный путь к файлу.
  • Если у вас возникнут проблемы с ffmpeg, убедитесь, что он правильно установлен и добавлен в PATH.

Если у вас возникнут дополнительные вопросы или проблемы, пожалуйста, дайте знать!

About

Speech Recognition with Yandex SpeechKit

Resources

Stars

Watchers

Forks

Languages