Skip to content

Latest commit

 

History

History
10 lines (7 loc) · 278 Bytes

README.md

File metadata and controls

10 lines (7 loc) · 278 Bytes

spider

python 爬虫

支持python3

版本1 功能简述: 以hao123为入口页面,滚动爬取外链,收集网址,并记录网址上的内链和外链数目,记录title等信息

windows7 32位上测试,目前每24个小时,可收集数据为10万左右