1 . 写在开头
2 . 反爬分类以及对应解决方案
-
2.1 消息头鉴别
-
2.2 IP判别
-
2.3 请求参数、主体判别
-
2.4 验证码判定
-
2.5 用户行为判别
-
2.6 前端反调试Debug
- 2.6.1 死循环Debug拦截DevTools
-
2.7 APP验签
3 . 大V推荐
创建这个项目的初衷是有几点在日常工作和学习中的感悟:
(1)接触到的反爬场景少,预先的知识储备不足,真正面对的时候学习周期长,解决难题时间长以致项目延期。
(2)想要抽空学习,却不知道从哪里入手,没有合适的反爬的社群来交流讨论经验,没有完整可用的案例来辅助学习,网上的案例简单并且基础,不适合想要深入学习的人。
(3)追求挑战性,这点我想是很多爬虫爱好者的“天性”,正如安全圈子一样,大家总用“英雄主义”的理想,想着没有攻克的难关,所以,就需要新的“难关”抛出,于是,就希望建立这个项目以及相关小组能够帮助大家实现自己的“英雄梦”。
项目其实很简单,我们会主要分为两个部分,也就是大家通常学习的顺序 - “理论”和“实战”,还有一些我们小组自研的开源库,帮助大家平常减少重复造轮子。
理论方面: 我们会总结一下常见的反爬类型以及对应的解决方案、实际案例。
实际案例方面:我们会结合真实的网站,详细的针对其反爬手段来进行分析。
我们的想法很简单:“正如没有穿不透的墙,也没有反不了的反爬”
加入我们,反“反爬”。