🛡️ Use RAG to Enhance Retrieve With LLM

Phân tích lỗ hổng bảo mật trong Smart Contracts thông qua Chatbot AI ứng dụng RAG (Retrieval-Augmented Generation).

🚀 Mục tiêu

Dự án sử dụng các mô hình ngôn ngữ lớn (LLM) kết hợp với cơ chế truy xuất tri thức (RAG) để:

Hiểu và phân tích hợp đồng thông minh
Tìm kiếm và giải thích các lỗ hổng bảo mật
Giao tiếp với người dùng thông qua chatbot AI thân thiện

🧠 Công nghệ sử dụng

Python
LangChain
Qwen2-1.5B-Instruct (qua Hugging Face)
OpenAI GPT-4o mini (tùy chọn)
FAISS Vector Database
Hugging Face Transformers

🏗️ Cấu trúc thư mục

VULNHUNT_GPT/
├── data/                 # Chứa dữ liệu đầu vào hoặc smart contracts
├── rag-venv/             # Virtual environment (nên được gitignore)
├── vectorstores/         # Lưu FAISS vector db
├── .env                  # File chứa các biến môi trường (API Keys)
├── .gitignore
├── llm_model.py          # Định nghĩa mô hình & pipeline LangChain
├── qabot-gpt.py          # Khởi chạy chatbot sử dụng OpenAI GPT
├── qabot-qwen.py         # Khởi chạy chatbot sử dụng Qwen2-1.5B
├── upload_data.py        # Tải và nhúng dữ liệu vào vector store
└── README.md

⚙️ Cài đặt

1. Clone repo:

git clone https://github.com/2uaan1ee/basic-rag-llm.git
cd basic-rag-llm

2. Cài đặt môi trường:

python -m venv rag-venv
rag-venv\Scripts\activate
pip install -r requirements.txt

3. Cấu hình API keys:

Tạo file .env với nội dung:

OPENAI_API_KEY=your_openai_api_key
HUGGINGFACEHUB_API_TOKEN=your_huggingface_token

Đảm bảo bạn đã đăng nhập bằng huggingface-cli login nếu sử dụng HuggingFace.

📦 Chuẩn bị dữ liệu

python upload_data.py

Dữ liệu sẽ được xử lý và lưu dưới dạng vector FAISS trong thư mục vectorstores.

🧪 Chạy chương trình

Với GPT-4o (qua OpenAI):

python qabot-gpt.py

Với Qwen2-1.5B (qua Hugging Face):

python qabot-qwen.py

📌 Ghi chú

Dự án hỗ trợ cả mô hình cloud (OpenAI) và local (Qwen2).
Đảm bảo RAM tối thiểu 8GB nếu sử dụng Qwen local.
Tùy chọn GPU để tăng tốc khi dùng Hugging Face models.

📜 License

MIT License

🙌 Đóng góp

Mọi đóng góp, chỉnh sửa hoặc mở rộng dự án đều rất hoan nghênh! Bạn có thể mở issue hoặc tạo pull request.

📬 Liên hệ

Nếu bạn có thắc mắc, hãy liên hệ qua GitHub Issues hoặc email quan.minhle26f@gmal.com

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🛡️ Use RAG to Enhance Retrieve With LLM

🚀 Mục tiêu

🧠 Công nghệ sử dụng

🏗️ Cấu trúc thư mục

⚙️ Cài đặt

1. Clone repo:

2. Cài đặt môi trường:

3. Cấu hình API keys:

📦 Chuẩn bị dữ liệu

🧪 Chạy chương trình

Với GPT-4o (qua OpenAI):

Với Qwen2-1.5B (qua Hugging Face):

📌 Ghi chú

📜 License

🙌 Đóng góp

📬 Liên hệ

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.vscode		.vscode
app/src		app/src
data		data
rerank		rerank
vectorstores/db_faiss		vectorstores/db_faiss
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
llm_model.py		llm_model.py
qabot-gpt.py		qabot-gpt.py
qabot-qwen.py		qabot-qwen.py
requirements.txt		requirements.txt
upload_data.py		upload_data.py

License

2uaan1ee/basic-rag-llm

Folders and files

Latest commit

History

Repository files navigation

🛡️ Use RAG to Enhance Retrieve With LLM

🚀 Mục tiêu

🧠 Công nghệ sử dụng

🏗️ Cấu trúc thư mục

⚙️ Cài đặt

1. Clone repo:

2. Cài đặt môi trường:

3. Cấu hình API keys:

📦 Chuẩn bị dữ liệu

🧪 Chạy chương trình

Với GPT-4o (qua OpenAI):

Với Qwen2-1.5B (qua Hugging Face):

📌 Ghi chú

📜 License

🙌 Đóng góp

📬 Liên hệ

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages