Dieses Projekt bietet ein Beispiel für ein autarkes Konferenztool mit Audio-Transkription und Sprechererkennung.
- Backend: FastAPI mit Vosk (Speech-to-Text) und Resemblyzer (Speaker Diarization)
- Frontend: Tkinter-GUI zum Hochladen und Anzeigen von Transkriptionen
- Python-Abhängigkeiten installieren
- Backend starten
- Frontend starten
- Das Projekt ist Open-Source und läuft lokal.
- Für Echtzeit-Transkription wird eine gute CPU empfohlen.