- 运行
git clone https://github.com/KevinWang676/VITS2-Chinese.git
cd VITS2-Chinese
pip install -r requirements.txt
- 运行
cd monotonic_align
python setup.py build_ext --inplace
- 上传语音文件:请上传一段中文、单说话人的语音文件,建议为较大数据集对应的
.wav
文件
- 语音切片:在filename处填写上传的语音文件名
python split.py --filename {filename}.wav
- 语音标注:标注完成后,可以在
filelists/short_character_anno.list
文件中对标注内容微调
python short_audio_transcribe.py --languages "C" --whisper_size large
- 语音预处理
python preprocess.py
- 开始训练
python train.py -c ./configs/config.json -m OUTPUT_MODEL
- 推理
Based on MB-iSTFT-VITS2