本文使用携程平台的景区游客评论进行文本挖掘,生成了多个变量来反映评论的“内蕴价值”,包括文本相似度、情感得分、词性分布、评论长度等,并系统地分析了不同变量的作用方式和效果。通过建立分类模型,本文分析了它们与用户评分的相关程度与相对重要性,进而设计了基于评论指标优化的数据产品,来对景区内部精选评论的选取排序及榜单的准入标准提供有效的改进建议。
-
Notifications
You must be signed in to change notification settings - Fork 1
Wang-ZH-Stat/Comment-Text-Mining
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
本文使用携程平台的景区游客评论进行文本挖掘,生成了多个变量来反映评论的“内蕴价值”,包括文本相似 度、情感得分、词性分布、评论长度等,并系统地分析了不同变量的作用方式和效果。通过建立分类模型,本文分 析了它们与用户评分的相关程度与相对重要性,进而设计了基于评论指标优化的数据产品,来对景区内部精选评论 的选取排序及榜单的准入标准提供有效的改进建议。
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published