🚀 微信公众号安全文章知识库 - 自动抓取、分类、归档微信公众号安全文章,构建专业安全知识库
- 多维度关键词匹配:覆盖威胁情报、漏洞利用、安全运营、应急响应、溯源分析等11个专业领域
- 智能去重机制:避免重复文章,确保知识库质量
- 实时数据同步:支持指定日期和历史数据抓取
- 威胁态势分析:自动分析安全威胁分布和趋势
- 漏洞类型统计:分类统计各类漏洞信息
- 详细匹配规则:展示所有关键词分类和匹配逻辑
- 完整文章列表:按数据源分组展示所有匹配文章
- 分层目录结构:
doc/年/年-月/年-W周/年-月-日/文章.md - 数据持久化:通过
data.json记录处理历史,支持断点续传 - Markdown转换:自动将微信文章转换为标准Markdown格式
| 数据源 | 描述 | 更新频率 |
|---|---|---|
| ChainReactors | GitHub安全文章聚合,专注于漏洞复现和技术分析 | 每日 |
| BruceFeIix | 安全文章收集,涵盖威胁情报和安全运营 | 每日 |
| Doonsec | 安全资讯RSS,实时推送安全事件和漏洞预警 | 实时 |
复现|漏洞|漏洞利用|漏洞挖掘|漏洞检测|漏洞分析|漏洞修复|漏洞防护|漏洞扫描|漏洞评估|漏洞管理|漏洞响应|漏洞预警|漏洞通报|SQL注入|XSS攻击|CSRF攻击|文件上传|文件包含|命令注入|代码注入|反序列化|缓冲区溢出|权限提升|越权访问|未授权访问|逻辑漏洞|配置错误|弱口令|默认密码|硬编码|敏感信息泄露|注入|XSS|内网|域控|RCE|代码执行|命令执行|远程代码执行|本地代码执行|权限绕过|信息泄露|拒绝服务|内存破坏|整数溢出|格式化字符串|竞争条件|时间竞争|路径遍历|目录遍历|文件包含|命令注入|代码注入
威胁情报|威胁检测|威胁狩猎|威胁分析|威胁建模|威胁评估|威胁预警|情报收集|情报分析|情报共享|情报平台|情报系统|情报运营|恶意软件|恶意代码|恶意行为|恶意活动|恶意攻击|恶意威胁|APT攻击|APT组织|APT活动|APT威胁|APT检测|APT分析|威胁情报平台|威胁情报系统|威胁情报分析|威胁情报共享
应急响应|安全响应|事件响应|应急处理|应急管理|应急演练|溯源分析|攻击溯源|威胁溯源|恶意代码溯源|网络溯源|数字取证|取证分析|证据收集|证据保全|证据链|时间线分析|攻击链分析|威胁狩猎|威胁追踪|威胁定位|威胁识别|威胁分类|威胁评估|安全事件|安全告警|安全日志|安全监控|安全检测|安全分析
安全运营|安全运维|安全管理|安全治理|安全合规|安全审计|安全监控|安全分析|安全评估|安全测试|安全培训|安全意识|安全架构|安全设计|安全开发|安全部署|安全配置|安全策略|安全控制|安全防护|安全检测|安全响应|安全恢复|安全备份|安全日志|安全事件|安全告警|安全报告|安全指标|安全度量|安全工具|安全平台|安全系统|安全服务|安全咨询|安全外包|安全团队|安全专家|安全工程师|安全分析师|安全管理员|漏洞运营|SRC|安全运营框架|安全治理框架
红队|蓝队|紫队|攻防演练|渗透测试|安全评估|漏洞扫描|安全测试|安全审计|安全评估|风险评估
社会工程学|钓鱼攻击|水坑攻击|供应链攻击|零日攻击|侧信道攻击|中间人攻击|拒绝服务|分布式拒绝服务|DDoS|勒索软件|木马|后门|病毒|蠕虫|僵尸网络|银狐
CVE-|CNVD-|CNNVD-|XVE-|QVD-|POC|EXP|0day|1day|nday|CWE-|ISO27001|NIST|OWASP|CIS|SOC|SIEM|SOAR|威胁情报标准|安全运营框架|安全治理框架
信息泄漏|数据泄露|隐私泄露|数据安全|隐私保护|身份认证|访问控制|会话管理|加密算法|加密协议|数字签名|证书管理|密钥管理|密码学|密码破解|多因子认证|单点登录
云安全|容器安全|DevSecOps|云原生安全|微服务安全|区块链安全|人工智能安全|机器学习安全|深度学习安全|量子计算威胁|AI安全威胁|5G安全威胁|边缘计算安全|零信任架构|微分段|微隔离|自适应安全|智能安全
应用安全|Web安全|移动安全|Web应用安全|移动应用安全|API安全|Windows安全|Linux安全|macOS安全|Android安全|iOS安全
物联网安全|工业安全|供应链安全|金融安全|医疗安全|教育安全|政府安全|企业安全|关键基础设施安全|工业控制系统安全|智能电网安全
防火墙|入侵检测|入侵防护|安全网关|VPN|加密|审计日志|安全扫描|漏洞扫描|渗透测试|代码审计|安全评估
- Python 3.8+:核心处理逻辑
- wechatmp2markdown:微信文章转Markdown工具
- requests:HTTP请求处理
- xml.etree.ElementTree:RSS解析
- logging:详细日志记录
wxvuln/
├── run.py # 主程序
├── data.json # 数据记录文件
├── doc/ # 文章存储目录
│ └── 2025/
│ └── 2025-01/
│ └── 2025-W04/
│ └── 2025-01-20/
│ └── 文章.md
├── md/ # 每日报告目录
│ └── 2025-01-20.md # 每日安全报告
├── bin/ # 工具目录
│ └── wechatmp2markdown-v1.1.11_linux_amd64
└── README.md
- 数据获取:从多个数据源获取安全文章
- 智能去重:基于URL和内容去重
- 关键词过滤:应用11个领域的关键词匹配
- 文章转换:转换为Markdown格式
- 报告生成:生成每日安全态势报告
- 数据持久化:更新处理记录
# 克隆项目
git clone https://github.com/adminlove520/mpvulnHub.git
cd wxvuln
# 安装依赖
pip install requests
# 运行今日抓取
python3 run.py
# 指定日期抓取
python3 run.py --date 2025-01-20
# 历史数据抓取
python3 run.py --history
# 指定日期范围抓取
python3 run.py --range 2025-01-01 2025-01-31- GitHub Actions 每4小时自动执行一次
| 参数 | 说明 | 示例 |
|---|---|---|
--date |
指定日期抓取 | --date 2025-01-20 |
--range |
指定日期范围 | --range 2025-01-01 2025-01-31 |
--history |
抓取历史数据 | --history |
2025-07-26 16:43:12,884 - INFO - === 开始处理 2025-01-20 的数据 ===
2025-07-26 16:43:12,884 - INFO - Doonsec原始数据: 200 个
2025-07-26 16:43:12,884 - INFO - ChainReactors原始数据: 165 个
2025-07-26 16:43:12,885 - INFO - 去重后共 355 个URL待处理,跳过 175 个重复URL
2025-07-26 16:43:12,898 - INFO - 关键词过滤: 匹配 73 个,跳过 282 个
2025-07-26 16:43:12,902 - INFO - 已创建每日报告: md/2025-01-20.md
# 2025-01-20 安全威胁态势报告
## 📊 数据概览
- **总文章数**: 73
- **数据源分布**:
- Doonsec: 43篇
- ChainReactors: 30篇
## 🚨 安全威胁态势分析
### 威胁类型分布
- **漏洞利用**: 12篇
- **攻击技术**: 12篇
- **威胁情报**: 6篇
- **安全运营**: 4篇
- **信息泄露**: 4篇- 关键词覆盖:11个专业领域,200+个关键词
- 匹配精度:智能过滤,减少误匹配
- 处理速度:支持批量处理,高效去重
- 数据源:3个主要安全数据源
- 更新频率:每4小时自动更新
- 存储格式:标准Markdown,便于阅读和搜索
data.json:记录已处理URL,避免重复run.log:详细运行日志,便于调试
wechatmp2markdown:微信文章转Markdown工具- 支持Linux/Windows/macOS多平台
如果您发现任何问题或有改进建议,请提交Issue。
欢迎提交新功能建议,特别是:
- 新的数据源
- 关键词优化
- 报告格式改进
- Fork 项目
- 创建功能分支
- 提交更改
- 发起Pull Request