Qdrant Hybrid Search with GPU Acceleration

Sistema de busca híbrida otimizado para GPU RTX 4000, combinando embeddings densos multilinguais e esparsos para máxima precisão.

🚀 Características

Busca Híbrida: Combina embeddings densos (semânticos) e esparsos (léxicos)
GPU Otimizado: Configurado para RTX 4000 com 8GB VRAM
Modelos de Alta Qualidade:
- Dense: intfloat/multilingual-e5-large (suporta 100+ idiomas)
- Sparse: prithivida/Splade_PP_en_v1 (otimizado para precisão)
API REST: FastAPI com documentação automática
Integração n8n: Webhooks prontos para automação
Docker Ready: Deploy fácil no Easypanel

📋 Requisitos

Docker com suporte NVIDIA GPU
NVIDIA Driver >= 525.60.13
CUDA >= 12.0
8GB+ RAM
10GB+ espaço em disco

🛠️ Instalação

1. Clone o repositório

git clone https://github.com/seu-usuario/qdrant-hybrid-search.git
cd qdrant-hybrid-search

2. Configure as variáveis de ambiente

cp .env.example .env
# Edite .env com suas configurações

3. Build e execute com Docker Compose

# Build da imagem
docker-compose build

# Iniciar serviços
docker-compose up -d

# Ver logs
docker-compose logs -f

🔌 API Endpoints

Health Check

GET /health

Indexar Documentos

POST /index
Content-Type: application/json
Authorization: Bearer YOUR_API_KEY

{
  "documents": [
    {
      "id": "doc1",
      "text": "Seu texto aqui",
      "metadata": {"category": "example"}
    }
  ]
}

Busca Híbrida

POST /search
Content-Type: application/json
Authorization: Bearer YOUR_API_KEY

{
  "query": "sua consulta de busca",
  "mode": "hybrid",  # ou "dense" ou "sparse"
  "limit": 10
}

Listar Coleções

GET /collections
Authorization: Bearer YOUR_API_KEY

🔧 Integração com n8n

Webhook para Busca

No n8n, adicione um node "Webhook"
Configure o método como POST
URL: http://seu-servidor:8000/webhook
Body:

{
  "action": "search",
  "data": {
    "query": "busca texto",
    "limit": 5
  }
}

Webhook para Indexação

{
  "action": "index",
  "data": {
    "documents": [
      {
        "text": "Documento para indexar",
        "metadata": {}
      }
    ]
  }
}

🚀 Deploy no Easypanel

Usando a Imagem Pronta do GitHub Container Registry

# Use este docker-compose.production.yml no Easypanel
image: ghcr.io/work-flow-manager/qdrant-hybridsearch:latest

Deploy Rápido

Via Interface Web

Acesse o Easypanel em http://seu-servidor:3000
Crie um novo projeto
Escolha "Docker Compose"
Cole o conteúdo do docker-compose.yml
Configure as variáveis de ambiente
Deploy!

Via CLI

# Na pasta do projeto
easypanel deploy --compose docker-compose.yml

📊 Performance

Com RTX 4000 (8GB VRAM):

Indexação: ~500 docs/segundo
Busca: <50ms latência média
Batch Size Ótimo: 32 documentos
Uso de VRAM: ~3-4GB com modelos carregados

🔍 Modos de Busca

Hybrid (Padrão)

Combina resultados densos e esparsos usando Reciprocal Rank Fusion (RRF). Melhor para: Consultas gerais com alta precisão.

Dense

Usa apenas embeddings semânticos multilinguais. Melhor para: Busca por significado, cross-lingual.

Sparse

Usa apenas embeddings léxicos esparsos. Melhor para: Correspondência exata de termos, nomes próprios.

🛡️ Segurança

API Key obrigatória para endpoints sensíveis
CORS configurável
Rate limiting disponível
Logs estruturados em JSON

📝 Variáveis de Ambiente

Variável	Descrição	Padrão
`API_KEY`	Chave de API para autenticação	-
`USE_GPU`	Habilitar aceleração GPU	true
`BATCH_SIZE`	Tamanho do batch para GPU	32
`QDRANT_HOST`	Host do Qdrant	qdrant
`N8N_WEBHOOK_ENABLED`	Habilitar webhooks	true

🐛 Troubleshooting

GPU não detectada

# Verificar NVIDIA drivers
nvidia-smi

# Verificar Docker GPU support
docker run --rm --gpus all nvidia/cuda:12.1.0-base-ubuntu22.04 nvidia-smi

Out of Memory (OOM)

Reduza BATCH_SIZE no .env
Aumente MAX_SEQUENCE_LENGTH gradualmente

Modelos não carregando

# Limpar cache e re-download
docker-compose down
rm -rf models/*
docker-compose up --build

📚 Documentação da API

Após iniciar, acesse:

Swagger UI: http://localhost:8000/docs
ReDoc: http://localhost:8000/redoc

🤝 Contribuindo

Pull requests são bem-vindos! Para mudanças maiores, abra uma issue primeiro.

📄 Licença

MIT

🆘 Suporte

Issues: GitHub Issues
Email: seu-email@example.com
Discord: [Link do Discord]

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
.github/workflows		.github/workflows
app		app
.env.example		.env.example
.env.gpu		.env.gpu
.env.production		.env.production
.gitignore		.gitignore
ANALISE_GPU_FINAL.md		ANALISE_GPU_FINAL.md
COMO_ACESSAR_PAINEL.md		COMO_ACESSAR_PAINEL.md
COMO_USAR_API.md		COMO_USAR_API.md
DEPLOY-EASYPANEL-FINAL.md		DEPLOY-EASYPANEL-FINAL.md
DEPLOY-GPU-GUIDE.md		DEPLOY-GPU-GUIDE.md
DEPLOY_EASYPANEL.md		DEPLOY_EASYPANEL.md
DIAGNOSTICO_COMPLETO.md		DIAGNOSTICO_COMPLETO.md
Dockerfile		Dockerfile
Dockerfile.all-in-one		Dockerfile.all-in-one
Dockerfile.cuda11		Dockerfile.cuda11
Dockerfile.cuda12		Dockerfile.cuda12
Dockerfile.easypanel		Dockerfile.easypanel
Dockerfile.easypanel-gpu		Dockerfile.easypanel-gpu
Dockerfile.final		Dockerfile.final
Dockerfile.gpu		Dockerfile.gpu
Dockerfile.gpu-ready		Dockerfile.gpu-ready
Dockerfile.production		Dockerfile.production
EASYPANEL-GPU-DEPLOY.md		EASYPANEL-GPU-DEPLOY.md
EASYPANEL-READY.md		EASYPANEL-READY.md
EASYPANEL_INSTRUCOES.md		EASYPANEL_INSTRUCOES.md
FIX-EASYPANEL-TIMEOUT.md		FIX-EASYPANEL-TIMEOUT.md
GPU-DEPLOY-GUIDE-RTX4000.md		GPU-DEPLOY-GUIDE-RTX4000.md
NVIDIA-REQUIREMENTS.md		NVIDIA-REQUIREMENTS.md
README.md		README.md
build-and-push.sh		build-and-push.sh
deploy-easypanel.sh		deploy-easypanel.sh
deploy-local-gpu.sh		deploy-local-gpu.sh
deploy.sh		deploy.sh
docker-compose-gpu.yml		docker-compose-gpu.yml
docker-compose.gpu-official.yml		docker-compose.gpu-official.yml
docker-compose.gpu.yml		docker-compose.gpu.yml
docker-compose.production.yml		docker-compose.production.yml
docker-compose.yml		docker-compose.yml
docker-run.sh		docker-run.sh
easypanel-config.json		easypanel-config.json
easypanel-deploy.md		easypanel-deploy.md
easypanel-final.yml		easypanel-final.yml
easypanel-gpu-force.yml		easypanel-gpu-force.yml
easypanel-template.json		easypanel-template.json
easypanel.json		easypanel.json
github_deploy_key.pub		github_deploy_key.pub
logs.md		logs.md
n8n-examples.json		n8n-examples.json
requirements.txt		requirements.txt
start-gpu-rtx4000.sh		start-gpu-rtx4000.sh
test-deploy.sh		test-deploy.sh
test_api.py		test_api.py
teste_api.py		teste_api.py

work-flow-manager/qdrant-hybridsearch

Folders and files

Latest commit

History

Repository files navigation