GitHub

大作业项目是使用歌词搜索歌词。

word2vec+TFIDF，使用Word2Vec得到词语的表示，然后使用TFIDF作为词语的权重组合得到歌词文档的向量表示。详细的文档说明参见 word2vec+TFIDF.md
tf-idf + LSA/SVD/PCA
WMD，来自这篇论文From word Embeddings To Document Distances

Name		Name	Last commit message	Last commit date
Latest commit History 88 Commits
dataset		dataset
models		models
webserver		webserver
.gitignore		.gitignore
README.md		README.md

Provide feedback