Skip to content

一个Python的网络爬虫,源码有三个文件,get_links用于获取所有的内容页链接,pretext用于对获取的链接进行预处理和剔重,afterparse用于对内容页的解析和提取文字写入文本文件

Notifications You must be signed in to change notification settings

chpagy/pythonSpider

About

一个Python的网络爬虫,源码有三个文件,get_links用于获取所有的内容页链接,pretext用于对获取的链接进行预处理和剔重,afterparse用于对内容页的解析和提取文字写入文本文件

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages