GitHub - hhhscvx/neuro-transcribe: Текстовая выжимка из видео

Видео —> Выжимка

За основу брал эту статью, но вместо NeMo использую whisperx (проще ставится) и в конце скармливаю в GPT для выжимки полученного

Этапы транскрибации:

ffmpeg для преобразования видео в .wav аудио, чтоб whisper-у было проще и лучше работать
whisper — делает транскрибацию из аудио в речь
whisperx — делает диаризация, разбивает речь по спикерам

Этапы установки:

poetry install
Поставить ffmpeg системно
Для whisperx:
- Зарегаться и получить Read токен на huggingface и указать в .env. Обязательно получить доступ на репо speaker-diarization-3.1 и segmentation-3.0
Установить прочие переменные окружения в .env: опираться на .env.example
Загрузить видео для транскрибации в директорию settings.INTERVIEWS_PATH

Запуск:

poetry run python main.py — начинает пайплайн для всех интервью, у которых еще нет готовой транскрибации (их нет в директории settings.SCRAPED_RESULT_PATH)
Есть флаги --skip-ffmpeg, --skip-whisper и --skip-whisperx, если нужно пропустить какой-то из этапов

Финал:

Скормить полученное любой LLM (например GPT) и попросить сделать выжимку. Лучше перед этим разбить по удобным чанкам:

python -m core.chunk_transcribed.py <filename> - filename без расширения, он берется из директории settings.SCRAPED_RESULT_PATH
Гайд на промпт для выжимки: prompt-guide.txt

Или вызов по отдельности:

ffmpeg:
- Затем python -m core.ffmpeg_scribe input.mp4 (файл берется из директории settings.INTERVIEWS_PATH)
whisper:
- python -m core.whisper_scribe input.wav (файл берется из директории settings.SCRAPED_FFMPEG_PATH)
whisperx (диаризация):
- python -m core.whisperx_diarize <filename> filename должен быть без расширения, подразуемевается, что есть filename.wav (после ffmpeg) и filename.json (после whisper)

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
core		core
.env.example		.env.example
.gitignore		.gitignore
README-EN.md		README-EN.md
README.md		README.md
main.py		main.py
poetry.lock		poetry.lock
prompt-guide.txt		prompt-guide.txt
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Видео —> Выжимка

Этапы транскрибации:

Этапы установки:

Запуск:

Финал:

Или вызов по отдельности:

About

Uh oh!

Releases

Packages

Languages

hhhscvx/neuro-transcribe

Folders and files

Latest commit

History

Repository files navigation

Видео —> Выжимка

Этапы транскрибации:

Этапы установки:

Запуск:

Финал:

Или вызов по отдельности:

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages