STS 中文文本语义相似度语料库建设
文本语义相似度(Semantic Text Similarity)是自然语言处理处理中的基本问题。
相似度值:[0,5],5:相似度最高(意思一样),0:相似度最低(语义相反或不相干)
应用范围:QA、自动客服、搜索引擎、语义理解、自动阅卷......
项目意义:目前英文sts语料训练数据较为丰富,中文sts(Chinese Semantic Text Similarity)语料很少,而语料是文本进行深度学习的基本起点。
项目实施起始日期:2016-06-06 06:06:06 0 0 131 66
如有引用或使用本训练集请注明作者信息: 唐善成, 白云悦, 马付玉. 中文语义相似度训练集. 西安科技大学.2016. https://github.com/IAdmireu/ChineseSTS
Tang Shancheng, Bai Yunyue, Ma Fuyu. Chinese Semantic Text Similarity Trainning Dataset. Xi'an University of Science and Technology.2016. https://github.com/IAdmireu/ChineseSTS