CQTNet

LEARNING A REPRESENTATION FOR COVER SONG IDENTIFICATION USING CONVOLUTIONAL NEURAL NETWORK. ICASSP2020

Environment

python -- 3 pytorch -- 1.0 librosa -- 0.63

Dataset

Second Hand Songs 100K (SHS100K), which is collected from Second Hand Songs website.

Generate CQT

You can utilize "gencqt.py" to get CQT features from your own audio.

Train

python main.py multi_train --model='CQTNet' --batch_size=32 --load_latest=False --notes='experiment0'

Test

python main.py test --model='CQTNet' --load_model_path = 'check_points/CQTNet.pth'

Paramters

https://drive.google.com/file/d/1Rv-NuiAKW2rUlNZj8SOs2Iqidqkx30M8/view?usp=sharing

Spectrum Augmentation

After using Spectrum Augmentation in training stage, the model performance has a great improvement.

Specaugment: A simple data augmentation method for automatic speech recognition.

Dataset	MAP
YouTube350	0.933
Covers80	0.860
Mazurkas	0.933
SHS100K-TEST	0.71

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
__pycache__		__pycache__
check_points		check_points
models		models
pasta		pasta
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.py		config.py
cqt_loader.py		cqt_loader.py
cqt_loader_setlist.py		cqt_loader_setlist.py
extract_cqtnet.ipynb		extract_cqtnet.ipynb
gencqt.py		gencqt.py
main.py		main.py
main2.ipynb		main2.ipynb
main2.py		main2.py
runDegbug.ipynb		runDegbug.ipynb
utility.py		utility.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CQTNet

Environment

Dataset

Generate CQT

Train

Test

Paramters

Spectrum Augmentation

About

Releases

Packages

Languages

License

silvadirceu/CQTNet

Folders and files

Latest commit

History

Repository files navigation

CQTNet

Environment

Dataset

Generate CQT

Train

Test

Paramters

Spectrum Augmentation

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages