Skip to content

Multimedia Magic – Audio Visual Heaven – Working Space – Realistic Anime Lector / AudioBooks (ノ◕ヮ◕)ノ*:・゚✧

License

Notifications You must be signed in to change notification settings

MattyMroz/mm_avh_working_space

Repository files navigation

✨MM_AVH✨
✨WORKING SPACE✨

Spis Treści

📝 Krótki Opis

Multimedia Magic – Audio Visual Heaven (MM_AVH) to zestaw narzędzi do przetwarzania i ulepszania multimediów. Repozytorium MM_AVH Working Space służy jako przestrzeń robocza do ciągłego pobierania, ulepszania i generowania multimediów.

MM_AVH składa się z wielu programów, które są stosowane sekwencyjnie, umożliwiając wielowarstwowe przetwarzanie multimediów. Narzędzia obejmują m.in:

  • playery, readery, konwertery, edytory, wizualizatory, analizatory, generatory, itp.
  • skalowanie
  • interpolację
  • zarządzanie napisami
  • lektorowanie wideo (dubbingowanie w przyszłości)
  • tworzenie audiobooków
  • automatyczne tłumaczenie tekstów i wiele innych.

Celem MM_AVH jest udostępnienie zaawansowanych, łatwych w użyciu narzędzi do manipulacji multimediów. MM_AVH Working Space jest częścią większego projektu, który ma na celu udostępnienie darmowego dostępu do multimediów i ułatwienie ich ulepszania i modyfikacji. Praca nad ulepszaniem MM_AVH jest ciągła, a repozytorium jest miejscem, gdzie te ulepszenia są opracowywane i testowane. Projekt MM_AVH skupia się również na odkrywaniu i dzieleniu się programami, które mogą poprawić jakość i wygodę odbioru multimediów.

📦 Zawartość

Projekt MM_AVH Working Space składa się z następujących głównych plików i folderów:

  • assets: Folder zawierający prezentacje i zrzuty ekranu. Ten folder nie jest niezbędny do działania projektu i może być usunięty.
  • bin: W tym folderze znajdują się wszystkie pliki wykonywalne (exe) oraz modele używane w projekcie. Podfoldery obejmują:
    • balabolka
    • esrgan
    • ffmpeg
    • mkvtoolnix
    • models
  • data: Folder zawierający proste ustawienia programu terminalowego.
  • installation.zip: Plik zawierający instalatory głosów systemowych.
  • modules: Moduły stworzone specjalnie dla tego projektu.
  • tests: Folder zawierający testy nowych rozwiązań. Ten folder nie jest niezbędny do działania projektu i może być usunięty.
  • utils: Moduły, które mogą być używane w innych projektach.
  • working_space: Folder roboczy, do którego przekazujemy pliki do przetworzenia. Zawiera podfoldery output i temp, które zawierają odpowiednio wyniki przetwarzania i pliki tymczasowe.
  • constants.py: Plik zawierający stałe ustawienia programu, takie jak ścieżki do folderów i kolorystyka.
  • LICENSE: Plik zawierający informacje o licencji projektu.
  • README.md: Plik zawierający wszystkie informacje, które powinieneś wiedzieć o projekcie.
  • start.py: Plik, który uruchamia proces przetwarzania.
  • requirements.txt: Plik zawierający listę bibliotek wymaganych do działania projektu.

Struktura folderów projektu wygląda następująco:

mm_avh_working_space
├───assets ... ❌
├───bin
│   ├───balabolka
│   ├───esrgan
│   ├───ffmpeg ...
│   │   ├───bin
│   ├───mkvtoolnix ...
│   └───models
├───data
├───modules
├───tests ❌
├───utils
└───working_space ❗
    ├───output
    └───temp
        ├───alt_subs
        └───main_subs

Pliki na poziomie głównym to:

  • constants.py
  • installation.zip
  • LICENSE
  • README.md
  • requirements.txt
  • start.py

❌ - zbędne po zapoznaiu się z używaniem programu

❗ - ważne

🔗 Linki

🔍 Wymagania

Aby korzystać z MM_AVH Working Space, musisz spełnić następujące wymagania:

  • System operacyjny: Windows. Program nie jest przeznaczony do użytku na innych systemach operacyjnych, takich jak Linux czy MacOS.
  • Python: Wersja 10 lub nowsza. Możesz pobrać najnowszą wersję Pythona z oficjalnej strony Pythona.
  • FFmpeg: Musi być zainstalowany i dodany do zmiennej środowiskowej PATH. Instrukcje instalacji FFmpeg można znaleźć tutaj.
  • Pliki wykonywalne (exe): Niektóre części kodu korzystają z zewnętrznych aplikacji na Windowsie, które są dostarczane jako pliki exe. Te pliki muszą być dostępne w ścieżce systemowej lub w określonym miejscu, które jest zdefiniowane w ustawieniach programu.
  • Znajomość obsługi terminala: Ponieważ program jest aplikacją terminalową, użytkownik musi być zaznajomiony z podstawowymi operacjami terminala.
  • Zarządzanie ustawieniami: Większość ustawień programu jest automatycznie zapisywana w odpowiednim pliku JSON.

Proszę zauważyć, że niektóre funkcje programu mogą wymagać dodatkowych zależności, które są określone w pliku requirements.txt.

⚡ Instalacja

Aby zainstalować i skonfigurować MM_AVH Working Space, wykonaj następujące kroki:

  1. Pobierz skompresowany program: Pobierz skompresowaną paczkę mm_avh_working_space.zip:
  • Bezpośrednio z Hugging Face (wykrywa jako niebezpieczny, bo zawiera pliki exe, które nie spełniają norm bezpieczeństwa *_*)
  1. Rozpakuj pliki: Rozpakuj pobrane pliki do wybranej lokalizacji.

  2. Przejdź do katalogu projektu: Przejdź do głównego katalogu projektu mm_avh_working_space Na przykład w CMD: cd mm_avh_working_space

  3. Instaluj zależności Pythona: Zainstaluj zależności Pythona z pliku requirements.txt za pomocą polecenia pip install -r requirements.txt.

  4. Poprawa jakości audio dla edge-tts: Aby poprawić jakość audio dla edge-tts, wykonaj następujące kroki:

    • W Visual Studio Code (VSC) znajdź plik modules/subtitle_to_speech.py, najedź kursorem na Communicate i naciśnij Ctrl + Click, aby przejść do communicate.py.
    • Wyszukaj w pliku communicate.py audio-24khz-48kbitrate-mono-mp3 i zamień na audio-24khz-96kbitrate-mono-mp3.
  5. Instalacja głosów systemowych: Program korzysta z głosów systemowych dostarczanych przez Speech2Go i IVONA. Instalatory znajdują się w pliku installation.zip.

  6. Konfiguracja głosów API: Program korzysta z edge-tts dla głosów API. Lista dostępnych głosów edge znajduje się pod tym linkiem lub w folderze tests/tts_online_edge_test_1.py. Istnieje również możliwość korzystania z Google TTS, ale jakość dźwięku może nie być zadowalająca dla długotrwałego słuchania.

  7. Konfiguracja głosów Eleven Labs: Program może również korzystać z głosów dostarczanych przez Eleven Labs. Nie jest wymagana żadna dodatkowa instalacja lokalnie, ale musisz skierować się do odpowiedniego repozytorium GitHub z notatnikiem Google Colab i instrukcjami obsługi. Repozytorium znajdziesz pod adresem: 11Labs_TTS_Colab_Shere. PS.: Możliwe jest również korzystanie z głosów Eleven Labs za pomocą API, lokalnie, ale ta funkcja nie jest jeszcze zaimplementowana, ze względu na koszty API..., poprzednie rozwiązanie jest darmowe.

Po wykonaniu powyższych kroków, MM_AVH Working Space powinien być gotowy do użycia!

🔄 Aktualizacje

Główne aktualizacje będą wykonywane przeze mnie. Możesz pobrać najnowszą wersję za pomocą poniższego linku, tak samo jak w przypadku pierwszej instalacji.

Pobierz najnowszą wersję MM_AVH Working Space

📝 Opis Programów

MM_AVH Working Space to zestaw narzędzi do przetwarzania plików multimedialnych, szczególnie plików MKV. Oto, co robi:

  1. Ekstrahuje różne ścieżki (audio i napisy) z plików MKV w celu ich segregacji i przetworzenia.

  2. Dzieli napisy w formacie ASS na podstawie poszczególnych stylów zawartych w pliku, a następnie konwertuje je na format SRT, gdzie później mogą być przetłumaczone.

  3. Może zamienić liczby w napisach na liczebniki, co może być potencjalnie niegramatyczne, ale jest użyteczne w niektórych kontekstach.

  4. Generuje audio na podstawie ustawień zawartych w pliku settings.json. Po wygenerowaniu audio, lektor jest łączony z audio.

  5. Łączy wszystko w jeden plik MKV z napisami pobocznymi + lektorem lub z wypalonymi napisami.

  6. Działa jako generator audiobooków. Wystarczy przekazać plik TXT lub SRT do folderu working_space/temp. Uwaga: plik po generacji zostanie usunięty.

Dzięki tym funkcjom, MM_AVH Working Space jest potężnym narzędziem do przetwarzania i tworzenia plików multimedialnych, szczególnie dla osób pracujących z plikami MKV i audiobookami.

📸 Demonstracja

📌 Uwagi

Chociaż MM_AVH Working Space został stworzony z myślą o ułatwieniu przetwarzania plików multimedialnych, pamiętaj, że korzystasz z tego zestawu narzędzi na własne ryzyko.

Podczas korzystania z MM_AVH Working Space, zawsze upewnij się, że masz kopie zapasowe swoich danych. Nie ponoszę odpowiedzialności za utratę danych lub uszczerbek na mieniu, który może wyniknąć z użycia tego zestawu narzędzi.

Pamiętaj, że jesteś odpowiedzialny za przestrzeganie wszelkich praw autorskich i innych praw własności intelektualnej podczas korzystania z MM_AVH Working Space.

📄 Licencja

Ten projekt jest licencjonowany na podstawie licencji zawartej w pliku LICENCE dostępnym w tym samym folderze co ten plik README.

Zachęcam do zapoznania się z pełnym tekstem licencji, aby zrozumieć, jakie prawa i obowiązki wynikają z korzystania z MM_AVH Working Space.

📧 Kontakt

Jeśli masz jakiekolwiek pytania, sugestie lub chcesz skontaktować się ze mną w innej sprawie, możesz wysłać mi e-mail:

Wyślij e-mail

Czekam na Twoją wiadomość!

About

Multimedia Magic – Audio Visual Heaven – Working Space – Realistic Anime Lector / AudioBooks (ノ◕ヮ◕)ノ*:・゚✧

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published