Skip to content

一个简单的python爬虫,原生python+BeautifulSoup

Notifications You must be signed in to change notification settings

ni-cheng/Pythonspider

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

43 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Pythonspider,一个简单的python爬虫

  • 娱乐随手写的,代码不太严谨,仅仅实现功能
  • 原生python+BeautifulSoup4
  • python3.4版本
  • 所有脚本要和spider.py放到同一目录下
  • 自行下载BeautifulSoup4 的类库 window下 pip install bs4即可

爬取知乎的爬虫 zhihu.py

  • 主要实现 爬取一个收藏夹 里 所有问题答案下的 图片
  • 文字信息暂未收录,可自行实现,比图片更简单
  • 具体代码里有详细注释,请自行阅读

子文件夹文件说明:

文件名 说明
*.py文件 爬虫程序
*.sql文件 数据表结构
*.html文件 数据展示
*.php文件 数据展示界面数据接口

About

一个简单的python爬虫,原生python+BeautifulSoup

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 66.8%
  • HTML 26.9%
  • PHP 6.3%