Awesome-AI-Redteam

❗【免责声明】本项目所涉及的技术、思路和工具仅供学习，任何人不得将其用于非法用途和盈利，不得将其用于非授权渗透测试，否则后果自行承担，与本项目无关。使用本项目前请先阅读法律法规。

Disclaimer: The technologies, concepts, and tools provided in this Git repository are intended for educational and research purposes only. Any use for illegal activities, unauthorized penetration testing, or commercial purposes is strictly prohibited. Please read the Awesome-Laws before using this repository.

📖 一个 AI 攻防知识库。A knowledge base for AI security.

👍 means recommend 推荐使用

开源资源 Open-Source Resources
治理与风险管理 Governance & Risk Management
进攻性安全 Red Teaming and Offensive Security
- LLM & Agent 对抗性安全 LLM & Agent Adversarial Security
- AI 赋能攻击性安全 AI-Assisted Offensive Security
防御性安全 Blue Teaming and Defensive Security
评测基准 Benchmarks & Evaluations
- 模型榜单 Model Rankings
- 基准 Benchmarks
商业化 Commercial

开源资源 Open-Source Resources

资源清单 Resource Collections

Awesome-LLM：一份精选大模型资源清单。
Awesome-Chinese-LLM：整理开源的中文 LLM，以规模较小、可私有化部署、训练成本较低的模型为主，包括底座模型，垂直领域微调及应用，数据集与教程等。
awesome-deepseek-integration：DeepSeek 实用集成，将 DeepSeek 大模型能力轻松接入各类软件。
awesome-cybersecurity-agentic-ai：网络安全智能体资源清单。
huggingface：供机器学习领域从业者围绕模型、数据集与应用开展协作的平台。
awesome-ai-security：一份精选清单，收录优质的人工智能安全相关框架、规范标准、学习资料与开源工具。
awesome-offensive-security-ai：精选的优秀进攻性安全 AI 工作、论文、组织、库和基准。
offensive-ai-compilation：一份汇总整理的、涵盖攻击性人工智能相关实用资源清单。
awesome-codex-cli：收录 150 余款适用于 OpenAI Codex 命令行工具的 tools, skills, subagents & plugins。
Offensive AI Agentic：腾讯黑客松，AI 渗透测试 / LLM 红队 / 自主攻击 Agent / 漏洞挖掘领域的开源项目、学术论文、能力评测 Benchmark 与国内外商业化解决方案。
Awesome-AI-Hacking-Agents：AI Hacking Agents 清单。
MCP-SecurityTools：MCP-SecurityTools 是一个专注于收录和更新网络安全领域 MCP 的开源项目，旨在汇总、整理和优化各类与 MCP 相关的安全工具、技术及实战经验。

学术论文 Papers

todo

实验环境 Lab Environments

Zero2Claude：从 0 开始学习 Claude Code。👍
Gandalf：AI 提示词注入 Challenge。
Damn Vulnerable MCP Server：MCP 漏洞教学靶场。
Vulnerable MCP Servers Lab：一套特意设置成存在安全漏洞、用于学习渗透测试的 MCP 服务器集群。
AI-Red-Teaming-Playground-Labs：Microsoft 项目，可开展人工智能红蓝对抗培训的人工智能红队演练实验环境，配套相关基础设施。
Damn Vulnerable LLM Agent：LLM Agent 安全，聊天机器人教学靶场。
benchmark-platform：AI Agent CTF 靶场竞赛平台。

提示词 Prompts

prompts.chat：优质 ChatGPT 提示词库，可在社区分享、查找、收集各类 AI 提示词。项目免费开源，企业可自主部署私有化服务，数据隐私完全可控。
awesome-chatgpt-prompts-zh：ChatGPT 中文调教指南。各种场景使用指南。学习怎么让它听你的话。
wonderful-prompts：中文 prompt 精选，ChatGPT 使用指南，提升 ChatGPT 可玩性和可用性！
system_prompts_leaks：从 Anthropic 提取的系统提示 - Claude Code, Claude Design, Opus 4.8, Sonnet 4.6. OpenAI - ChatGPT 5.5 Thinking, GPT 5.5 Instant, Codex, Google - Gemini - 3.5 Flash, 3.1 Pro, Antigravity, xAI - Grok, Cursor, Copilot, VS Code, Perplexity 等。
CL4R1T4S：完整提取自 OpenAI、Google、Anthropic、xAI、Perplexity、Cursor、Windsurf、Devin、Manus、Replit 等公司的系统提示、指南和工具。

编排框架 Orchestration Frameworks

langchain：LangChain 是一款用于构建智能代理与 LLM 驱动型应用的开发框架。
AutoGPT：自主式 AI Agent 框架，可实现复杂工作流程自动化。

大模型部署与工具链 Deployment & Toolchain

ollama：快速上手使用 Kimi-K2.6、GLM-5.1、MiniMax、DeepSeek、gpt-oss、通义千问、Gemma 等各类模型。
open-webui：Open WebUI 是一款可扩展、功能丰富且易用的自建人工智能平台，能够完全离线运行。
chatbox：Chatbox 是一个 AI 模型桌面客户端，支持 ChatGPT、Claude、Google Gemini、Ollama 等主流模型，适用于 Windows、Mac、Linux、Web、Android 和 iOS 全平台。
anythingllm：借助强大的内置工具和功能快速运行本地 LLM，支持 MacOS/Windows/Linux 系统。
enchanted：Enchanted 是一款适用于 iOS 与 macOS 的应用程序，可借助 Ollama，对接本地私有化部署的 Llama2、Mistral、Vicuna 等 LLM 进行对话交互。
obsidian-copilot：Obsidian 插件。
continue：可在持续集成流程中强制执行的源码管控式 AI 校验工具，基于开源工具 Continue CLI 驱动。

Agent Skills

Anthropic-Cybersecurity-Skills：面向人工智能智能体的 754 项结构化网络安全技能・适配五大框架：MITRE ATT&CK、NIST CSF 2.0、MITRE ATLAS、D3FEND 以及 NIST AI RMF。
pentest-ai-agents：35 个 Claude Code 渗透 Subagent。
claude-bug-bounty：AI 驱动的漏洞赏金挖掘，信息侦察、20 类漏洞类型、自主化漏洞探测以及报告生成。
llm-sast-scanner：一种静态应用安全测试（SAST）技术，可赋能 AI 代码智能体针对 34 类漏洞开展结构化漏洞检测。
sast-skills：可将 AI 代码开发工具转变为静态应用安全测试扫描器的智能代理技能合集。
Trail of Bits Skills：安全研究、漏洞挖掘与审计流程。
Elastic Agent Skills：Elastic 官方 skills 库，日志、追踪、威胁情报。
Semgrep Skills：安全扫描、代码分析、漏洞检测。
claude-secure-coding-rules：面向 Claude 代码的安全编码规范。
awesome-agent-skills：精选的 AI Agent Skills 列表，适用于 Cursor、Claude Code、GitHub Copilot 等 AI 编程工具。
awesome-agent-skills：Agent Skills 终极指南：快速入门、资源推荐、精选技能与实用工具。
awesome-agent-skills：收录来自官方开发团队与社区的 1000 余项 Agent Skills 技能。
Anthropics Skills：Anthropics 官方 skills 库。skill-creator 用于生成自定义 skills。
ECC：来自 Anthropic 黑客马拉松获胜者的完整 Claude Code 配置集合。不止是配置文件，而是一整套完整系统：技能体系、本能行为、记忆优化、持续学习、安全扫描，以及研究优先的开发模式。包含可直接用于生产环境的智能体、技能模块、钩子、规则、MCP 配置，以及兼容传统命令的适配层。可在 Claude Code、Codex、Cursor、OpenCode、Gemini 及其他 AI 智能体框架中通用。
baoyu-skills：AI Agent 技能集（适用于 Claude Code、Codex 等），提升日常工作效率。
SecSkills：收集整理渗透测试、漏洞扫描、代码审计、CTF、逆向、安全研究等网络安全相关的 Skills 和 MCP。

治理与风险管理 Governance & Risk Management

框架 Frameworks

NIST - AI Risk Management Framework：NIST 人工智能风险管理框架（AI RMF）
ISO/IEC 42001:2023：ISO/IEC 人工智能管理系统标准
ISO/IEC 23894:2023：ISO/IEC 人工智能风险评估管理体系
Google's Secure AI Framework：Google 安全 AI 框架，人工智能安全实操指南
ENISA - Multilayer Framework for Good Cybersecurity Practices for AI：ENISA AI 网络安全多层框架
OWASP-www-project-ai-maturity-assessment：OWASP AI 成熟度评估

标准与验证 Standards & Verification

OWASP-AISVS：AI Security Verification Standard (AISVS）旨在为开发人员、架构师与安全从业者提供一套结构化核查清单，用于核验人工智能应用的安全能力。
OWASP-ANS：依托 OWASP 生成式人工智能安全项目 —— 智能体安全专项研发的 Agent Name Service（ANS），推出了一套借鉴域名系统（DNS）设计的安全框架，用于实现人工智能智能体的寻址发现。该服务依托公钥基础设施（PKI）完成身份核验，采用标准化 JSON 模式开展数据交互，同时配备协议适配层，可兼容 A2A、MCP 与 ACP 三类协议。
OWASP Agent Observability Standard：Agent 可观测性标准。

术语体系与数据库 Taxonomies & Databases

NIST AI 100-2 E2023：对抗性机器学习攻击与防御措施的分类及术语说明
MITRE ATLAS：对抗性 AI 战术与技术知识库
AVIDML：AI 风险分类体系
MIT AI Risk Repository：AI 风险数据库
AI Incident Database：AI 安全事件数据库
Arcanum PI Taxonomy：Prompt Injection 攻击分类体系
CSA Large Language Model (LLM) Threats Taxonomy：CSA LLM 威胁分类体系
OWASP-AIVSS：AI 漏洞评分系统

清单与指南 Checklists & Guidance

OWASP ML TOP 10
OWASP LLM TOP 10
OWASP Agentic TOP 10
MLSecOps TOP 10
OpenClaw Security Engineer's Cheat Sheet：OpenClaw 安全工程师 CheetSheet
OWASP LLM Applications Cybersecurity and Governance Checklist ：OWASP LLM 应用安全与治理清单
OWASP AI Security and Privacy Guide：OWASP AI 安全与隐私指南
OWASP Agentic AI – Threats and Mitigations：OWASP Agentic AI 威胁与缓解措施
OWASP Securing Agentic Applications Guide：OWASP 保护 Agentic AI 应用
OWASP GenAI Red Teaming Guide：OWASP GenAI 红队指南
OWASP CheatSheet – A Practical Guide for Securely Using Third-Party MCP Servers：OWASP MCP 服务器安全使用清单
OWASP Multi-Agentic system Threat Modeling Guide：OWASP Multi-Agentic 系统威胁建模

进攻性安全 Red Teaming and Offensive Security

LLM & Agent 对抗性安全 LLM & Agent Adversarial Security

综合红队框架 Comprehensive Red Teaming Frameworks

garak：Nvidia 项目，LLM 漏洞扫描器。
promptfoo：测试提示词、智能代理与检索增强生成（RAG）。面向人工智能开展红蓝对抗 / 渗透测试 / 漏洞扫描。
PyRIT：Microsoft 项目，面向生成式 AI 的 Python 风险识别工具（PyRIT）是一款开源框架，旨在帮助安全从业人员与工程师主动排查生成式人工智能系统中的各类风险。
PurpleLlama：Meta 项目，LLM 安全评估与改进工具集。
deepteam：一款针对 LLM 及其系统开展红队测试的框架。
augustus：一款用于检测提示注入、越狱攻击与对抗攻击的大模型安全测试框架 —— 内置 190 余项测试探针、适配 28 个服务商，编译后为单个 Go 可执行文件。
ai-scanner：基于 Nvidia garak 搭建的人工智能模型安全扫描工具。
AI-Infra-Guard：腾讯朱雀实验室，AI 红队平台（Infra/MCP/Jailbreak）。

越狱与对抗测试 Jailbreak & Adversarial Testing

PromptJailbreakManual：Prompt 越狱手册。
EasyJailbreak：一个轻量、易用、纯 Python 实现的对抗性越狱提示词生成框架。
GPTFuzz：利用自动生成的越狱提示词对 LLM 开展红蓝对抗测试。
FuzzyAI：CyberArk 项目，LLM 自动化 Fuzz 工具。
G0DM0D3：一款完全开源、注重隐私保护的多模型对话交互程序，它不断突破后训练层的技术上限，可用于红队测试、认知科学研究以及自由化人工智能交互场景。

Prompt 注入 Prompt Injection

OpenPromptInjection：为 LLM 中的提示注入攻击与防护方案提供了一套基准测试标准。
promptmap：一款面向定制化大模型应用的自动化提示注入扫描工具。
llm-security：利用间接提示注入攻击 LLM。Paper

Agent 安全 Agent Security

RAMPART：Microsoft 出品，Agent AI 安全测试框架（pytest 原生）。
Agentic Radar：面向大模型智能体工作流的安全扫描工具。
agentic_security：智能体大模型漏洞扫描工具 / 人工智能红队测试套件。
giskard-oss：主流开源 LLM 智能体评测。

AI 赋能攻击性安全 AI-Assisted Offensive Security

Some projects may not be fully tested. Use with caution. 部分项目未经完整测试，请谨慎使用。

渗透测试 Penetration Agents

CyberStrikeAI：CyberStrikeAI 是一款基于 Go 语言开发的原生人工智能安全测试平台。该平台集成了一百余款安全工具、智能编排引擎、搭载预设安全角色的基于角色测试模块、具备专项测试能力的技能体系以及全生命周期管理功能。
shannon：Shannon 是一款面向网页应用与应用程序接口的自主式白盒人工智能渗透测试工具。它能够分析源代码、定位攻击切入点，并通过执行真实漏洞利用程序，在漏洞上线投产前完成漏洞验证。
PentestGPT：基于 LLM 的自动化渗透测试智能体框架。
strix：开源 AI 黑客，排查并修复你的应用程序漏洞。
JoySafeter：一款企业级智能体平台 —— 不止于对话交互，依托可视化编排实现自主智能体团队的搭建、部署、测试与全链路追踪。
cai：Cybersecurity AI (CAI)，人工智能安全框架。
pentagi：可执行复杂渗透测试任务的全自主智能体系统。
raptor： Raptor 将 Claude Code 转化为通用型 AI 攻防安全代理。
hexstrike-ai：MCP 服务端，可支持 Claude、GPT、Copilot 等各类 AI 智能代理自主调用 150 余款网络安全工具。
redamon：一款依托人工智能驱动的自主化红队框架，可在无需人工介入的前提下，自动化完成从情报侦察、漏洞利用到后渗透阶段的各类攻击性安全任务。
guardian-cli：Guardian 是企业级人工智能驱动的自动化渗透测试框架，该框架整合多家人工智能服务商（OpenAI GPT-4、Claude、Google Gemini、OpenRouter）与经过实战验证的安全工具，可实现智能化、自适应安全评估，并完整留存取证资料。
AutoPentestX：自动化渗透测试与漏洞报告生成工具。
pentest-ai-agents：将 Claude Code 打造为你的攻击性安全研究助手。
hackGPT：使用 ChatGPT 进行黑客攻击。
LuaN1aoAgent：新一代基于大模型的自主渗透测试智能体。
deadend-cli：智能自主渗透测试工具。该工具依托 KIMI K2.5 模型，在 XBOW 基准测试的纯黑盒场景下目前得分 81%。

漏洞研究 Vulnerability Research

vulnhuntr：基于 LLM 的 0day 漏洞挖掘。
buttercup：LLM 驱动的漏洞发现与漏洞修复。
DeepAudit：代码漏洞挖掘多智能体系统。已成功发现并获得 49 个 CVE 编号和 6 个 GHSA 安全公告。

逆向与反编译 Reverse Engineering & Decompilation

android-reverse-engineering-skill：Claude Code Skill，Android 反汇编与 API 提取。
js-reverse-automation--skill：结合 chrome-devtools-mcp 的能力并加上 Skill 的规范，实现 JSRPC+Flask+autoDecoder 方案的前端 JS 逆向自动化分析，提升 JS 逆向的效率。

CTF Capture the Flag

Tsec-Hackathon：腾讯云智能渗透黑客松。
BreachWeave：智能渗透 Agent Manager/Observer/Solver 多角色架构，基于 pi-mono SDK。Tsec-Hackathon 1st。
BoxPwnr：一套模块化框架，用于在 HackTheBox、TryHackMe、PortSwigger、Cybench、picoCTF 等平台的安全攻防题目上，对大语言模型与智能体方案开展基准性能测评。
ctf-agent：BSidesSF 2026 CTF 冠军。

MCP 集成 MCP Security Integration

mcp-for-security：一套适配主流安全工具的模型上下文协议服务端合集，涵盖 SQLMap、FFUF、NMAP、Masscan 等多款常用工具，可将安全测试与渗透测试功能接入人工智能工作流。
mcp-security-hub：一套不断扩充的 MCP 服务器合集，可为人工智能助手集成攻击性安全工具，包含 Nmap、Ghidra、Nuclei、SQLMap、Hashcat 等多款工具。
mcp-server：Burp Suite MCP 服务器。
chrome-devtools-mcp：用于代码编写代理的 Chrome DevTools 工具。

防御性安全 Blue Teaming and Defensive Security

安全围栏 Guardrails

Guardrails：Nvidia 项目，NeMo Guardrails 是一款开源工具包，可便捷地为基于大语言模型的对话系统添加可编程安全防护规则。
LlamaFirewall：Meta 项目，LlamaFirewall 是一款用于检测和缓解人工智能相关安全风险的框架，支持多层面的输入与输出场景，包括常规大语言模型对话以及更为复杂的多步骤智能体任务运行。
llm-guard：LLM 安全加固综合工具。
rebuff：Prompt Injection 检测器。
langkit：一款用于监控大语言模型（LLMs）的开源工具包。

运行时安全与沙箱 Runtime Security & Sandboxing

OpenShell：Nvidia 项目，OpenShell 是面向自主智能体的安全、私密运行环境。
OpenSandbox：面向 AI 智能体，安全、高性能、可扩展的沙箱运行时环境。
CubeSandbox：面向智能体的即时、并发、安全且轻量型沙箱。
Aegis：面向智能体的开源终端检测与响应（EDR）工具。
Agent Governance Toolkit：Microsoft 项目，Agent 治理工具包，覆盖 OWASP Agentic Top 10。
microsandbox：轻量 microVM 沙箱。
claude-code-safety-net：Claude Code 破坏性命令拦截插件，兼容 Codex、Claude Code、OpenCode、Gemini CLI 以及 Copilot CLI。
pipelock：面向 MCP 安全的开源 AI 智能体防火墙，出站管控、数据防泄漏、服务端请求伪造防护以及提示注入防御。
onecli：自带密钥保管库的开源凭证网关，可在不泄露密钥的前提下让 AI 智能体访问各类服务。

MCP 安全 MCP Security

MCP-Security-Checklist：MCP 安全检查清单。
Awesome-MCP-Security：MCP 安全知识大全。
agent-scan：面向 AI 智能体、MCP 服务器以及智能体 Skills 的安全扫描工具。
mcpproxy-go：MCP 代理。

模型与制品扫描 Model & Artifact Scanning

skill-scanner：Agent Skills 安全扫描工具。
modelscan：防范模型序列化攻击。
picklescan：Python Pickle 可疑操作检测。
fickling：一款针对 Python pickle 对象序列化的反编译器、静态分析工具与字节码改写工具。
medusa：搭载 76 项分析器、9600 余条检测规则，可针对人工智能 / 机器学习、大语言模型智能代理与 MCP 服务器实现代码仓库投毒检测。

AI 赋能防御性安全 AI-Assisted Defensive Security

Claude Code Security Reviewer：一款依托 Claude 实现的 AI 安全审查 GitHub 动作，用于分析代码变更中存在的安全漏洞。
deepsec：Code Agents 驱动，用于在代码库中查找漏洞的安全检测工具。
AiSOC：开源人工智能驱动型安全运营中心 —— 告警融合、红蓝对抗演练、智能代理辅助研判、基于 MITRE ATT&CK 框架开展事件溯源分析。

AI 工具 AI Tools

AutoGPT：AutoGPT 是一个强大的平台，可帮助您创建、部署和管理持续运行的 AI 智能体，实现复杂工作流程的自动化。

评测基准 Benchmarks & Evaluations

模型榜单 Model Rankings

OpenRouter AI Model Rankings：依托基准测试数据以及数百万用户经由 OpenRoute 调用各类模型产生的实际使用数据。
Arena Leaderboard：查看主流人工智能模型在文本、图像、视觉等多领域的综合表现。
LLM Leaderboard：对比 300 余款顶尖 AI 模型的智能水平、运行速度与定价。

基准 Benchmarks

OpenCompass：OpenCompass 是一款 LLM 评测平台，依托百余种评测数据集，可对 Llama3、Mistral、InternLM2、GPT-4、LLaMa2、通义千问、GLM、Claude 等海量模型开展测评。
PurpleLlama：用于评估和优化 LLM 安全性的工具套件。
JailbreakBench：一款用于 LLM 越狱攻击的开源鲁棒性基准测评平台。NeurIPS 2024。
XBOW Validation Benchmarks：104 项 Web 漏洞挑战。
CyberGym：一套大规模、高质量的网络安全评测框架，旨在针对现实环境下的漏洞分析任务，对智能体的各项能力开展严谨测评。
NYU CTF Bench：NYU CTF 基准测试数据集。

商业化 Commercial

todo

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

Awesome-AI-Redteam

开源资源 Open-Source Resources

资源清单 Resource Collections

学术论文 Papers

实验环境 Lab Environments

提示词 Prompts

编排框架 Orchestration Frameworks

大模型部署与工具链 Deployment & Toolchain

Agent Skills

治理与风险管理 Governance & Risk Management

框架 Frameworks

标准与验证 Standards & Verification

术语体系与数据库 Taxonomies & Databases

清单与指南 Checklists & Guidance

进攻性安全 Red Teaming and Offensive Security

LLM & Agent 对抗性安全 LLM & Agent Adversarial Security

综合红队框架 Comprehensive Red Teaming Frameworks

越狱与对抗测试 Jailbreak & Adversarial Testing

Prompt 注入 Prompt Injection

Agent 安全 Agent Security

AI 赋能攻击性安全 AI-Assisted Offensive Security

渗透测试 Penetration Agents

漏洞研究 Vulnerability Research

逆向与反编译 Reverse Engineering & Decompilation

CTF Capture the Flag

MCP 集成 MCP Security Integration

防御性安全 Blue Teaming and Defensive Security

安全围栏 Guardrails

运行时安全与沙箱 Runtime Security & Sandboxing

MCP 安全 MCP Security

模型与制品扫描 Model & Artifact Scanning

AI 赋能防御性安全 AI-Assisted Defensive Security

AI 工具 AI Tools

评测基准 Benchmarks & Evaluations

模型榜单 Model Rankings

基准 Benchmarks

商业化 Commercial

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages