Skip to content

learnerhouse/jcml

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

jsml

项目主要用于爬虫检测 根据用户的访问特征来检测是否是爬虫

通过给定的几个特征标记爬虫和正常用户

通过学习正常用户的行为习惯来

爬虫的特点:

爬虫预赛选(机器性)

1、 链接特征 : 层次遍历链接(库) 深度遍历链接(库)

2、 时间特征 : 频繁访问(频率过高) 定时访问(周期性过高) 非正常时间访问(访问时间分布,提取异常访问)

About

judge crawler machine learning

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published