Skip to content

本文使用携程平台的景区游客评论进行文本挖掘,生成了多个变量来反映评论的“内蕴价值”,包括文本相似 度、情感得分、词性分布、评论长度等,并系统地分析了不同变量的作用方式和效果。通过建立分类模型,本文分 析了它们与用户评分的相关程度与相对重要性,进而设计了基于评论指标优化的数据产品,来对景区内部精选评论 的选取排序及榜单的准入标准提供有效的改进建议。

Notifications You must be signed in to change notification settings

Wang-ZH-Stat/Comment-Text-Mining

Repository files navigation

Comment-Text-Mining

本文使用携程平台的景区游客评论进行文本挖掘,生成了多个变量来反映评论的“内蕴价值”,包括文本相似度、情感得分、词性分布、评论长度等,并系统地分析了不同变量的作用方式和效果。通过建立分类模型,本文分析了它们与用户评分的相关程度与相对重要性,进而设计了基于评论指标优化的数据产品,来对景区内部精选评论的选取排序及榜单的准入标准提供有效的改进建议。

About

本文使用携程平台的景区游客评论进行文本挖掘,生成了多个变量来反映评论的“内蕴价值”,包括文本相似 度、情感得分、词性分布、评论长度等,并系统地分析了不同变量的作用方式和效果。通过建立分类模型,本文分 析了它们与用户评分的相关程度与相对重要性,进而设计了基于评论指标优化的数据产品,来对景区内部精选评论 的选取排序及榜单的准入标准提供有效的改进建议。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages