- 📝 Krótki Opis
- 📦 Zawartość
- 🔗 Linki
- 🔍 Wymagania
- ⚡ Instalacja
- 🔄 Aktualizacje
- 📝 Opis
- 📸 Demonstracja
- 📌 Uwagi
- 📄 Licencja
- 📧 Kontakt
Multimedia Magic – Audio Visual Heaven (MM_AVH) to zestaw narzędzi do przetwarzania i ulepszania multimediów. Repozytorium MM_AVH Working Space służy jako przestrzeń robocza do ciągłego pobierania, ulepszania i generowania multimediów.
MM_AVH składa się z wielu programów, które są stosowane sekwencyjnie, umożliwiając wielowarstwowe przetwarzanie multimediów. Narzędzia obejmują m.in:
- playery, readery, konwertery, edytory, wizualizatory, analizatory, generatory, itp.
- skalowanie
- interpolację
- zarządzanie napisami
- lektorowanie wideo (dubbingowanie w przyszłości)
- tworzenie audiobooków
- automatyczne tłumaczenie tekstów i wiele innych.
Celem MM_AVH jest udostępnienie zaawansowanych, łatwych w użyciu narzędzi do manipulacji multimediów. MM_AVH Working Space jest częścią większego projektu, który ma na celu udostępnienie darmowego dostępu do multimediów i ułatwienie ich ulepszania i modyfikacji. Praca nad ulepszaniem MM_AVH jest ciągła, a repozytorium jest miejscem, gdzie te ulepszenia są opracowywane i testowane. Projekt MM_AVH skupia się również na odkrywaniu i dzieleniu się programami, które mogą poprawić jakość i wygodę odbioru multimediów.
Projekt MM_AVH Working Space składa się z następujących głównych plików i folderów:
assets
: Folder zawierający prezentacje i zrzuty ekranu. Ten folder nie jest niezbędny do działania projektu i może być usunięty.bin
: W tym folderze znajdują się wszystkie pliki wykonywalne (exe) oraz modele używane w projekcie. Podfoldery obejmują:balabolka
esrgan
ffmpeg
mkvtoolnix
models
data
: Folder zawierający proste ustawienia programu terminalowego.installation.zip
: Plik zawierający instalatory głosów systemowych.modules
: Moduły stworzone specjalnie dla tego projektu.tests
: Folder zawierający testy nowych rozwiązań. Ten folder nie jest niezbędny do działania projektu i może być usunięty.utils
: Moduły, które mogą być używane w innych projektach.working_space
: Folder roboczy, do którego przekazujemy pliki do przetworzenia. Zawiera podfolderyoutput
itemp
, które zawierają odpowiednio wyniki przetwarzania i pliki tymczasowe.constants.py
: Plik zawierający stałe ustawienia programu, takie jak ścieżki do folderów i kolorystyka.LICENSE
: Plik zawierający informacje o licencji projektu.README.md
: Plik zawierający wszystkie informacje, które powinieneś wiedzieć o projekcie.start.py
: Plik, który uruchamia proces przetwarzania.requirements.txt
: Plik zawierający listę bibliotek wymaganych do działania projektu.
Struktura folderów projektu wygląda następująco:
mm_avh_working_space
├───assets ... ❌
├───bin
│ ├───balabolka
│ ├───esrgan
│ ├───ffmpeg ...
│ │ ├───bin
│ ├───mkvtoolnix ...
│ └───models
├───data
├───modules
├───tests ❌
├───utils
└───working_space ❗
├───output
└───temp
├───alt_subs
└───main_subs
Pliki na poziomie głównym to:
constants.py
installation.zip
❗LICENSE
README.md
requirements.txt
❗start.py
❗
❌ - zbędne po zapoznaiu się z używaniem programu
❗ - ważne
Aby korzystać z MM_AVH Working Space, musisz spełnić następujące wymagania:
- System operacyjny: Windows. Program nie jest przeznaczony do użytku na innych systemach operacyjnych, takich jak Linux czy MacOS.
- Python: Wersja 10 lub nowsza. Możesz pobrać najnowszą wersję Pythona z oficjalnej strony Pythona.
- FFmpeg: Musi być zainstalowany i dodany do zmiennej środowiskowej PATH. Instrukcje instalacji FFmpeg można znaleźć tutaj.
- Pliki wykonywalne (exe): Niektóre części kodu korzystają z zewnętrznych aplikacji na Windowsie, które są dostarczane jako pliki exe. Te pliki muszą być dostępne w ścieżce systemowej lub w określonym miejscu, które jest zdefiniowane w ustawieniach programu.
- Znajomość obsługi terminala: Ponieważ program jest aplikacją terminalową, użytkownik musi być zaznajomiony z podstawowymi operacjami terminala.
- Zarządzanie ustawieniami: Większość ustawień programu jest automatycznie zapisywana w odpowiednim pliku JSON.
Proszę zauważyć, że niektóre funkcje programu mogą wymagać dodatkowych zależności, które są określone w pliku requirements.txt
.
Aby zainstalować i skonfigurować MM_AVH Working Space, wykonaj następujące kroki:
- Pobierz skompresowany program: Pobierz skompresowaną paczkę
mm_avh_working_space.zip
:
- Bezpośrednio z Hugging Face (wykrywa jako niebezpieczny, bo zawiera pliki exe, które nie spełniają norm bezpieczeństwa *_*)
-
Rozpakuj pliki: Rozpakuj pobrane pliki do wybranej lokalizacji.
-
Przejdź do katalogu projektu: Przejdź do głównego katalogu projektu mm_avh_working_space Na przykład w CMD:
cd mm_avh_working_space
-
Instaluj zależności Pythona: Zainstaluj zależności Pythona z pliku
requirements.txt
za pomocą poleceniapip install -r requirements.txt
. -
Poprawa jakości audio dla edge-tts: Aby poprawić jakość audio dla edge-tts, wykonaj następujące kroki:
- W Visual Studio Code (VSC) znajdź plik
modules/subtitle_to_speech.py
, najedź kursorem naCommunicate
i naciśnijCtrl + Click
, aby przejść docommunicate.py
. - Wyszukaj w pliku
communicate.py
audio-24khz-48kbitrate-mono-mp3
i zamień naaudio-24khz-96kbitrate-mono-mp3
.
- W Visual Studio Code (VSC) znajdź plik
-
Instalacja głosów systemowych: Program korzysta z głosów systemowych dostarczanych przez Speech2Go i IVONA. Instalatory znajdują się w pliku
installation.zip
. -
Konfiguracja głosów API: Program korzysta z edge-tts dla głosów API. Lista dostępnych głosów edge znajduje się pod tym linkiem lub w folderze
tests/tts_online_edge_test_1.py
. Istnieje również możliwość korzystania z Google TTS, ale jakość dźwięku może nie być zadowalająca dla długotrwałego słuchania. -
Konfiguracja głosów Eleven Labs: Program może również korzystać z głosów dostarczanych przez Eleven Labs. Nie jest wymagana żadna dodatkowa instalacja lokalnie, ale musisz skierować się do odpowiedniego repozytorium GitHub z notatnikiem Google Colab i instrukcjami obsługi. Repozytorium znajdziesz pod adresem: 11Labs_TTS_Colab_Shere. PS.: Możliwe jest również korzystanie z głosów Eleven Labs za pomocą API, lokalnie, ale ta funkcja nie jest jeszcze zaimplementowana, ze względu na koszty API..., poprzednie rozwiązanie jest darmowe.
Po wykonaniu powyższych kroków, MM_AVH Working Space powinien być gotowy do użycia!
Główne aktualizacje będą wykonywane przeze mnie. Możesz pobrać najnowszą wersję za pomocą poniższego linku, tak samo jak w przypadku pierwszej instalacji.
MM_AVH Working Space to zestaw narzędzi do przetwarzania plików multimedialnych, szczególnie plików MKV. Oto, co robi:
-
Ekstrahuje różne ścieżki (audio i napisy) z plików MKV w celu ich segregacji i przetworzenia.
-
Dzieli napisy w formacie ASS na podstawie poszczególnych stylów zawartych w pliku, a następnie konwertuje je na format SRT, gdzie później mogą być przetłumaczone.
-
Może zamienić liczby w napisach na liczebniki, co może być potencjalnie niegramatyczne, ale jest użyteczne w niektórych kontekstach.
-
Generuje audio na podstawie ustawień zawartych w pliku
settings.json
. Po wygenerowaniu audio, lektor jest łączony z audio. -
Łączy wszystko w jeden plik MKV z napisami pobocznymi + lektorem lub z wypalonymi napisami.
-
Działa jako generator audiobooków. Wystarczy przekazać plik TXT lub SRT do folderu
working_space/temp
. Uwaga: plik po generacji zostanie usunięty.
Dzięki tym funkcjom, MM_AVH Working Space jest potężnym narzędziem do przetwarzania i tworzenia plików multimedialnych, szczególnie dla osób pracujących z plikami MKV i audiobookami.
Chociaż MM_AVH Working Space został stworzony z myślą o ułatwieniu przetwarzania plików multimedialnych, pamiętaj, że korzystasz z tego zestawu narzędzi na własne ryzyko.
Podczas korzystania z MM_AVH Working Space, zawsze upewnij się, że masz kopie zapasowe swoich danych. Nie ponoszę odpowiedzialności za utratę danych lub uszczerbek na mieniu, który może wyniknąć z użycia tego zestawu narzędzi.
Pamiętaj, że jesteś odpowiedzialny za przestrzeganie wszelkich praw autorskich i innych praw własności intelektualnej podczas korzystania z MM_AVH Working Space.
Ten projekt jest licencjonowany na podstawie licencji zawartej w pliku LICENCE dostępnym w tym samym folderze co ten plik README.
Zachęcam do zapoznania się z pełnym tekstem licencji, aby zrozumieć, jakie prawa i obowiązki wynikają z korzystania z MM_AVH Working Space.
Jeśli masz jakiekolwiek pytania, sugestie lub chcesz skontaktować się ze mną w innej sprawie, możesz wysłać mi e-mail:
Czekam na Twoją wiadomość!