Voicebank2DiffSinger は、UTAU音源から SOFA と MakeDiffSinger を用いて、DiffSinger 用の学習データセットを自動生成するツールです。
本ツールは、UTAU音源データを解析し、DiffSinger 用の学習データセットに変換します。内部では、SOFA モデル と MakeDiffSinger の仕組みを活用し、音声データの前処理・変換を自動で行います。
- 音源解析: UTAU音源から音素や単語のシーケンスを抽出します。
- SOFA モデル活用: 高精度な音声処理を実現するために、日本語用SOFAモデルを利用します。
- DiffSinger用データ生成: MakeDiffSingerとの連携で、DiffSinger用の学習データセットを生成します。
Directory structure:
└── Voicebank2DiffSinger/
├── README.md
├── README_EN.md
├── LICENSE
├── pyproject.toml
├── requirements.txt
├── uv.lock
├── .python-version
└── src/
├── g2p.py
├── main.py
├── utils.py
├── MakeDiffSinger/
├── SOFA/
├── ckpt/
│ └── .gitkeep
├── dictionaries/
│ └── .gitkeep
└── outputs/
└── .gitkeep
- OS: Windows
- 開発環境: C++(Visual Studioを用いたデスクトップ開発)、CMake
- Python: 3.11(3.12未満、3.11.11でテスト済み)
-
uv のセットアップ(オプション)
以下のコマンドを PowerShell で実行してください:
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
-
リポジトリのクローン
サブモジュールも含めてリポジトリをクローンし、ディレクトリに移動します:
git clone --recursive https://github.com/Lqm1/Voicebank2DiffSinger.git cd Voicebank2DiffSinger
-
必要モジュールのインストール
uv sync
-
日本語 SOFA モデルの導入
日本語のSOFAモデル から以下のファイルをダウンロードしてください:
step.100000.ckpt
をsrc/ckpt
フォルダへ配置japanese-extension-sofa.txt
をsrc/dictionaries
フォルダへ配置
-
リポジトリのクローン
サブモジュールも含めてリポジトリをクローンし、ディレクトリに移動します:
git clone --recursive https://github.com/Lqm1/Voicebank2DiffSinger.git cd Voicebank2DiffSinger
-
仮想環境の構築とアクティベート
python -m venv .venv .venv/scripts/activate
-
必要モジュールのインストール
pip install -r requirements.txt
-
日本語 SOFA モデルの導入
日本語のSOFAモデル から以下のファイルをダウンロードしてください:
step.100000.ckpt
をsrc/ckpt
フォルダへ配置japanese-extension-sofa.txt
をsrc/dictionaries
フォルダへ配置
-
仮想環境のアクティベート(pip インストールの場合)
.venv/scripts/activate
-
実行方法
src/main.py
に対して、音源(音階)フォルダを1つまたは複数引数として指定して実行します。例:python src/main.py example/A3 example/A2 example/A4
※ 各フォルダ内に対象の音源ファイルと、同名の
.txt
ファイル(ラベル情報)が必要です。
-
ファイル配置:
src/ckpt
およびsrc/dictionaries
に日本語SOFAモデルのファイルが正しく配置されていない場合、実行時にエラーが発生します。 -
依存関係:
本プロジェクトは多くの外部パッケージに依存しています。インストール時にエラーが発生した場合は、Pythonのバージョンや各パッケージのバージョンに注意してください。 -
詳細設定:
各モジュールの詳細な設定やカスタマイズ方法については、ソースコード内のコメントおよび各ディレクトリ内のドキュメントをご参照ください。
バグ報告、機能追加の提案、プルリクエストなど、どなたからの貢献も大歓迎です。まずは Issue をご利用ください。
このプロジェクトは GPL-3.0 License のもとで公開されています。
ご質問やご提案は、info@lami.zip までご連絡ください。