百度搜索链接解密 & 百度收录查询

百度的收录情况只给具体数字，却不说哪个被收录哪个没有。所以有必要根据百度搜索将所有链接提取出来。

这里记录了一些开发过程。

使用方法

提取加密链接观察网页发现，所有的加密链接都在data-tools=\'(.*?)\'里面，使用正则提取出来即可
解密链接模拟访问该加密链接，要么会返回一个自动跳转的js，要么在header中的location给出。要跳转的链接就是我们解密后的链接。
翻页网页是压缩过的，所有的换行符都删掉了。导致正则匹配下一页出现很大困难。贪婪模式和非贪婪模式都不好用，目前的措施是将</a>强制换为</a>\n, 即加上换行符。或许可以考虑使用html解析器，但是要测试速度差异。

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md