RAG (Retrieval Augmented Generation) with LLM

Сделано приложение, способное осуществлять QA при учитывании контента из любых предоставляемых сайтов. Надо передать список ссылок и далее можно задавать вопросы по данному материалу.

Запуск сервисов:

docker compose up -d --build

Сайт по работе с LLM (чат-бот с рагом) станет доступен после запуска компоуза по этому адресу - http://localhost:8501/

Код для работы с раг из python - rag_example.ipynb

Туториал по проекту - видео

Модели, что использованы в проекте (поднимаются локально):

LLM: Qwen/Qwen2.5-7B-Instruct-GPTQ-Int4
Embedder : intfloat/multilingual-e5-large-instruct
Reranker : BAAI/bge-reranker-v2-m3

Для Visual LLM могу рекомендовать такие модели:

Qwen/Qwen3-VL-8B-Instruct-FP8 - нужно порядка 25-30 Гб
Qwen/Qwen2-VL-7B-Instruct-GPTQ-Int4 - 16 Гб хватает при img=1

Как предустановить модель Qwen чтобы вольюм ее увидел и без инета запускал:

cd models/nlp/llm
git clone https://huggingface.co/Qwen/Qwen2.5-7B-Instruct-GPTQ-Int4

PS: если заменить command: --model /models/Qwen2.5-7B-Instruct-GPTQ-Int4 на --model Qwen/Qwen2.5-7B-Instruct-GPTQ-Int4 то модель сама скачается в кэш и не надо будет ее через git скачивать с хагингфеса (но тогда при каждом перезапуске будет качать ее)

В ветке GPT_VQA_Example можно найти примеры инференса готовых моделей в python по api. В том числе там пример с Visual LLM (VQA).

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
configs		configs
elements		elements
nodes		nodes
services		services
streamlit_pages		streamlit_pages
utils_local		utils_local
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
app.py		app.py
docker-compose.yaml		docker-compose.yaml
rag_example.ipynb		rag_example.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

RAG (Retrieval Augmented Generation) with LLM

Запуск сервисов:

About

Uh oh!

Releases 1

Packages

Languages

Koldim2001/RAG_LLM

Folders and files

Latest commit

History

Repository files navigation

RAG (Retrieval Augmented Generation) with LLM

Запуск сервисов:

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages