🔮 HELMo Oracle

HELMo Oracle est un moteur RAG (Retrieval-Augmented Generation) générique développé dans le cadre d'un projet académique à HELMo (Haute École Libre Mosane).

La démo tourne sur le lore de Dofus (MMORPG d'Ankama), mais l'architecture est entièrement générique : n'importe quel corpus de documents peut être ingéré pour créer un Oracle sur mesure, sans modifier une seule ligne de code.

Équipe : Tim · Maxime · Arnaud

Démo en ligne

Service	URL
Interface de chat	https://oracle.dlzteam.com
Page vitrine	https://tritech.dlzteam.com
API backend	https://api.dlzteam.com/docs
Dashboards	https://dashboard.dlzteam.com/

Fonctionnalités Clés

Mode de Déploiement Flexible :
- ☁️ Mode Cloud : Utilise Supabase pour l'authentification et une base PostgreSQL distante pour une solution de production robuste.
- 💻 Mode Local : Fonctionne 100% hors ligne avec une base de données vectorielle locale (ChromaDB) et un système de session basé sur des fichiers JSON. Idéal pour le développement et les tests rapides.
Pipeline d'Ingestion Avancé :
- Validation automatique du contenu par un LLM (Guardian).
- Détection des doublons grâce au hachage des chunks.
- Support multi-format (.pdf, .docx, .md, .csv, .json, .txt).
- Late chunking contextuel : chaque chunk est embedé avec le contexte de ses voisins grâce à nomic-embed-text via Ollama (8 192 tokens de contexte).
- Plus de détails sur le pipeline d'ingestion
Recherche Hybride Performante :
- Combine la recherche sémantique (similarité vectorielle) et la recherche par mots-clés (BM25).
- Utilise Reciprocal Rank Fusion (RRF) pour fusionner intelligemment les résultats.
- Comprendre la recherche hybride
Sécurité et Confidentialité :
- Anonymisation automatique des données personnelles (PII Masking) avant l'envoi aux LLMs.
- Comment fonctionne le PII Masking ?
Interface Réactive :
- Streaming des réponses en temps réel grâce au Vercel AI SDK.
- L'utilité du Vercel AI SDK
Supervision Humaine (Human-in-the-Loop) :
- Mécanismes de validation et de correction pour améliorer continuellement la pertinence du système.
- En savoir plus sur notre approche HITL

Prérequis

Python 3.12 (mode local uniquement)
Node.js 22+
Docker & Docker Compose (requis pour le backend en production)
Clés API :
- Au minimum, une clé Groq (gratuite) est nécessaire pour faire fonctionner l'agent.
- Pour l'ingestion de fichiers .pdf ou .docx, une clé Unstructured.io est fortement recommandée.

Le modèle d'embedding (nomic-embed-text) est téléchargé automatiquement dans un conteneur Ollama dédié. Aucune installation manuelle de modèle n'est requise.

Installation

Le projet peut être configuré de deux manières : un mode 100% local pour un démarrage rapide, ou un mode Cloud complet pour le développement et la production.

Option 1 : Mode 100% Local (Recommandé pour commencer)

Ce mode utilise ChromaDB comme base vectorielle locale et ne nécessite aucun compte externe (pas de Supabase).

Cloner le repo

git clone https://github.com/dlz-dev/helmo-oracle.git
cd helmo-oracle

Configurer et lancer le backend (api/)
```
cd api
cp .env.example .env
```
Modifiez api/.env :
- Assurez-vous que DATABASE_URL, SUPABASE_URL et LOG_DATABASE_URL sont vides ou commentés.
- Renseignez votre clé GROQ_API_KEY.
- (Optionnel) Renseignez votre clé UNSTRUCTURED_API_KEY pour les PDF/DOCX.
```
python -m venv .venv
# Sur Windows: .venv\Scripts\activate
# Sur Mac/Linux: source .venv/bin/activate
pip install -r requirements.txt
python -m spacy download fr_core_news_sm
python api.py
```
Configurer et lancer le frontend (web/)
```
cd ../web
npm install
cp .env.local.example .env.local
```
Modifiez web/.env.local :
- NEXT_PUBLIC_LOCAL_MODE=true
- BACKEND_API_URL=http://127.0.0.1:8000
```
npm run dev
```

Votre Oracle est maintenant accessible sur http://localhost:3000.

Option 2 : Mode Cloud avec Docker (recommandé pour la production)

Ce mode utilise Docker Compose pour orchestrer le backend et le service d'embedding, avec Supabase pour la base vectorielle, l'authentification et les logs.

1. Configurer Supabase

Créez un projet sur supabase.com.
Activez l'extension vector : Settings > Database > Extensions > vector.
Exécutez api/config/schema_supabase.sql dans l'éditeur SQL de Supabase.

Si la colonne vecteur existait déjà avec une autre dimension, exécutez d'abord ce script de migration avant de lancer l'ingestion :
DROP INDEX IF EXISTS idx_documents_cosine;
TRUNCATE TABLE public.documents;
ALTER TABLE public.documents ALTER COLUMN vecteur TYPE vector(768);
CREATE INDEX idx_documents_cosine
  ON public.documents USING ivfflat (vecteur vector_cosine_ops) WITH (lists = 100);

2. Configurer les variables d'environnement

cd api
cp .env.example .env

Dans api/.env, renseignez :

DATABASE_URL — URL PostgreSQL de Supabase (onglet Settings > Database).
SUPABASE_URL, SUPABASE_ANON_KEY, LOG_DATABASE_URL.
GROQ_API_KEY (et autres clés LLM selon vos besoins).
API_SECRET_KEY — clé secrète pour protéger les routes d'administration.

3. Construire et démarrer les conteneurs

cd api
docker compose up --build -d

Cela démarre deux conteneurs :

backend — l'API FastAPI sur le port 8000.
embedding_service — Ollama sur le port 11434, avec persistance dans ./ollama_data/.

4. Télécharger le modèle d'embedding (première fois uniquement)

docker exec embedding_service ollama pull nomic-embed-text

Le modèle est persisté dans le volume ./ollama_data/ — cette commande n'est à exécuter qu'une seule fois.

5. Vérifier que tout fonctionne

# Santé globale de l'API
curl http://localhost:8000/health

# Test du service Ollama
curl http://localhost:11434/api/tags

6. Configurer et lancer le frontend

cd ../web
npm install
cp .env.local.example .env.local

Dans web/.env.local :

NEXT_PUBLIC_LOCAL_MODE=false
BACKEND_API_URL=http://localhost:8000
NEXT_PUBLIC_SUPABASE_URL et NEXT_PUBLIC_SUPABASE_ANON_KEY.

npm run dev

Commandes Docker utiles

Commande	Description
`docker compose up --build -d`	Build et démarrage complet
`docker compose up -d`	Démarrage sans rebuild
`docker compose down`	Arrêt des conteneurs
`docker compose logs backend -f`	Logs du backend en temps réel
`docker exec embedding_service ollama pull nomic-embed-text`	(Re)télécharger le modèle
`docker exec embedding_service ollama list`	Lister les modèles installés

Adapter l'Oracle à votre domaine

Pour faire de l'Oracle un expert sur un autre sujet, aucune modification de code n'est nécessaire. Il suffit d'adapter les prompts.

Placez vos documents dans le dossier api/data/files/.
Modifiez les prompts dans le dossier api/config/ :
- prompt.txt: Définit la personnalité et les règles de base de l'agent. C'est le fichier le plus important à adapter.
- prompt_guardian.txt: Décrit les critères de pertinence pour accepter ou rejeter un document lors de l'ingestion.
- prompt_context.txt: Guide le LLM pour générer une description globale de chaque document.
- prompt_summary.txt: Instruction pour résumer les conversations et maintenir une mémoire à long terme.
Lancez une ingestion depuis le panel d'administration (/admin).

Panel d'Administration (`/admin`)

Le panel admin est le centre de contrôle de l'Oracle.

Gestion des Modèles : Choisissez le fournisseur (Groq, OpenAI, etc.) et le modèle à utiliser.
Configuration des Clés API : Saisissez et testez vos clés API.
Ingestion de Données : Lancez et suivez le processus d'ingestion de nouveaux documents.
Logs Système : Consultez les logs en temps réel (disponible uniquement en mode Cloud).

HELMo Oracle — Projet académique HELMo · 2026

Name		Name	Last commit message	Last commit date
Latest commit History 391 Commits
.github/workflows		.github/workflows
api		api
bot		bot
dashboard		dashboard
docs		docs
web		web
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🔮 HELMo Oracle

Démo en ligne

Fonctionnalités Clés

Prérequis

Installation

Option 1 : Mode 100% Local (Recommandé pour commencer)

Option 2 : Mode Cloud avec Docker (recommandé pour la production)

1. Configurer Supabase

2. Configurer les variables d'environnement

3. Construire et démarrer les conteneurs

4. Télécharger le modèle d'embedding (première fois uniquement)

5. Vérifier que tout fonctionne

6. Configurer et lancer le frontend

Commandes Docker utiles

Adapter l'Oracle à votre domaine

Panel d'Administration (`/admin`)

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🔮 HELMo Oracle

Démo en ligne

Fonctionnalités Clés

Prérequis

Installation

Option 1 : Mode 100% Local (Recommandé pour commencer)

Option 2 : Mode Cloud avec Docker (recommandé pour la production)

1. Configurer Supabase

2. Configurer les variables d'environnement

3. Construire et démarrer les conteneurs

4. Télécharger le modèle d'embedding (première fois uniquement)

5. Vérifier que tout fonctionne

6. Configurer et lancer le frontend

Commandes Docker utiles

Adapter l'Oracle à votre domaine

Panel d'Administration (/admin)

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Panel d'Administration (`/admin`)

Packages