Voicebank2DiffSinger

Voicebank2DiffSinger は、UTAU音源から SOFA と MakeDiffSinger を用いて、DiffSinger 用の学習データセットを自動生成するツールです。

概要

本ツールは、UTAU音源データを解析し、DiffSinger 用の学習データセットに変換します。内部では、SOFA モデル と MakeDiffSinger の仕組みを活用し、音声データの前処理・変換を自動で行います。

機能

音源解析: UTAU音源から音素や単語のシーケンスを抽出します。
SOFA モデル活用: 高精度な音声処理を実現するために、日本語用SOFAモデルを利用します。
DiffSinger用データ生成: MakeDiffSingerとの連携で、DiffSinger用の学習データセットを生成します。

ディレクトリ構造

Directory structure:
└── Voicebank2DiffSinger/
    ├── README.md
    ├── README_EN.md
    ├── LICENSE
    ├── pyproject.toml
    ├── requirements.txt
    ├── uv.lock
    ├── .python-version
    └── src/
        ├── g2p.py
        ├── main.py
        ├── utils.py
        ├── MakeDiffSinger/
        ├── SOFA/
        ├── ckpt/
        │   └── .gitkeep
        ├── dictionaries/
        │   └── .gitkeep
        └── outputs/
            └── .gitkeep

前提条件

OS: Windows
開発環境: C++（Visual Studioを用いたデスクトップ開発）、CMake
Python: 3.11（3.12未満、3.11.11でテスト済み）

インストール方法

uv を利用する方法 (高速インストール)

uv のセットアップ（オプション）

以下のコマンドを PowerShell で実行してください：
```
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
```
リポジトリのクローン

サブモジュールも含めてリポジトリをクローンし、ディレクトリに移動します：
```
git clone --recursive https://github.com/Lqm1/Voicebank2DiffSinger.git
cd Voicebank2DiffSinger
```
必要モジュールのインストール
```
uv sync
```
日本語 SOFA モデルの導入

日本語のSOFAモデルから以下のファイルをダウンロードしてください：
- step.100000.ckpt を src/ckpt フォルダへ配置
- japanese-extension-sofa.txt を src/dictionaries フォルダへ配置

pip を利用する方法

リポジトリのクローン

サブモジュールも含めてリポジトリをクローンし、ディレクトリに移動します：
```
git clone --recursive https://github.com/Lqm1/Voicebank2DiffSinger.git
cd Voicebank2DiffSinger
```
仮想環境の構築とアクティベート
```
python -m venv .venv
.venv/scripts/activate
```
必要モジュールのインストール
```
pip install -r requirements.txt
```
日本語 SOFA モデルの導入

日本語のSOFAモデルから以下のファイルをダウンロードしてください：
- step.100000.ckpt を src/ckpt フォルダへ配置
- japanese-extension-sofa.txt を src/dictionaries フォルダへ配置

使用方法

仮想環境のアクティベート（pip インストールの場合）
```
.venv/scripts/activate
```
実行方法

src/main.py に対して、音源（音階）フォルダを1つまたは複数引数として指定して実行します。例：
```
python src/main.py example/A3 example/A2 example/A4
```
※ 各フォルダ内に対象の音源ファイルと、同名の .txt ファイル（ラベル情報）が必要です。

注意事項

ファイル配置:
src/ckpt および src/dictionaries に日本語SOFAモデルのファイルが正しく配置されていない場合、実行時にエラーが発生します。
依存関係:
本プロジェクトは多くの外部パッケージに依存しています。インストール時にエラーが発生した場合は、Pythonのバージョンや各パッケージのバージョンに注意してください。
詳細設定:
各モジュールの詳細な設定やカスタマイズ方法については、ソースコード内のコメントおよび各ディレクトリ内のドキュメントをご参照ください。

貢献

バグ報告、機能追加の提案、プルリクエストなど、どなたからの貢献も大歓迎です。まずは Issue をご利用ください。

ライセンス

このプロジェクトは GPL-3.0 License のもとで公開されています。

連絡先

ご質問やご提案は、info@lami.zip までご連絡ください。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Voicebank2DiffSinger

目次

概要

機能

ディレクトリ構造

前提条件

インストール方法

uv を利用する方法 (高速インストール)

pip を利用する方法

使用方法

注意事項

貢献

ライセンス

連絡先

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
.vscode		.vscode
src		src
.gitignore		.gitignore
.gitmodules		.gitmodules
.python-version		.python-version
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
uv.lock		uv.lock

License

Lqm1/Voicebank2DiffSinger

Folders and files

Latest commit

History

Repository files navigation

Voicebank2DiffSinger

目次

概要

機能

ディレクトリ構造

前提条件

インストール方法

uv を利用する方法 (高速インストール)

pip を利用する方法

使用方法

注意事項

貢献

ライセンス

連絡先

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages