关于无法爬取页面内容的修复办法

研究了好几天，这个古老的项目终于又可以正常使用了，思路就是使用request全面替代aspider，需要设置一个看上去是正常浏览器的header（并不需要cookie登录），修改schedule.py 、bus _spider.py 、parser.py 三个文件，注意meta中的url以及tag_list中的tag_link都需要去除root_path
缺点就是爬取速度稍微慢了一些