软件 | 版本 |
---|---|
python | 3.6 |
requests | |
sqlalchemy | |
selenium | |
chromedriver | |
mysql | 5.7 |
sudo python3 -m pip install --upgrade pip
sudo python3 -m pip install --upgrade setuptools
sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ requests
sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ selenium
sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ sqlalchemy
- chrome与chromedriver安装自行百度
-
按顺序依次爬取cnvd的漏洞详情,起始url在代码中修改
-
使用sqlchemy保存数据,也可以改为csv文件存储
-
使用selenium反反爬虫,主要是获取cookie,每隔5次爬取自动打开浏览器获取一下新cookie
-
使用前请务必修改数据库的连接信息与User-Agent,UA必须与chromedriver的版本一致
-
mysql务必使用utf8字符集创建数据库
sudo python3 cnvd2.py