2021数据统计与分析竞赛
Adsa2101116.pdf为竞赛论文
question_1.py 等为问题1-5的程序
附件1为给出的原始数据
附件2为需要填写的数据文件
pro_附件2.xlsx为填写好的附件2文件
excel_R_to_word.py将excel文件中的文本数据转入txt文件。
text_words.txt为读取出来的文本数据
CNstopwords.txt为中文停词表
text_words_token.txt为切词后的文本文件
user_dict.txt为切词自定义字典
cluster.txt聚类结果
text_words_label.txt带文本数据的聚类结果