信息内容安全+机器学习算法
KeyWords:
爬虫、NLP文本分析、贝叶斯分类器 for 垃圾邮件过滤、K-means聚类 for 话题检测、PageRank+社团结构检测 for 人物关系网络分析
文件结构:
examples —— 简单的爬虫
SpamFliter —— 贝叶斯垃圾邮件过滤 (伯努利模型、多项式模型)
TopicDetection —— K-means聚类话题检测(K-means++、二分K-means)
relationship —— 人民的名义、红楼梦人物关系网络分析(PageRank、社团结构检测)