"Memory is not a file. It is a reconstruction."
Les systèmes actuels (RAG, Vector DBs) sont fragiles : si vous perdez le fichier d'index, vous perdez la mémoire. CRAID applique la logique du stockage RAID matériel à la mémoire sémantique. Il fragmente le savoir en "éclats" mathématiques et les distribue sur le réseau.
- Résultat : Vous pouvez perdre 40% de vos nœuds (Agents), le système reconstruira mathématiquement les souvenirs manquants sans perte de données.
Avant d'être stockée, l'information brute passe par un pipeline biologique (semantic_polymerase.md) :
- Helicase (Extraction) : Un SLM (Mistral/Phi) brise le texte en triplets Sujet-Verbe-Objet.
- Synthèse (Embedding) : Création d'un "Nucléotide Sémantique" (Vecteur + Sens).
- Distribution : Le nucléotide est envoyé au cluster CRAID.
Nous utilisons un Erasure Coding (Reed-Solomon).
- Standard (3, 2) : La donnée est coupée en 3 morceaux, et 2 blocs de parité sont calculés.
- Répartition : Ces 5 blocs sont envoyés à 5 agents différents.
- Reconstruction : Il suffit de récupérer n'importe quels 3 blocs pour régénérer le tout.
Pour gérer l'apprentissage continu sans corrompre les shards existants :
- Hot Memory (MemTable) : Les souvenirs récents vivent en RAM (rapide, volatile).
- Cold Storage (SSTables) : Une fois stabilisés, ils sont "vitrifiés" sur le disque en shards immuables.
La robustesse du système est définie mathématiquement dans FORMULAS.md.
Probabilité d'échec (
Avec une configuration
$(3,2)$ , la probabilité de perdre un souvenir est statistiquement négligeable, même dans un environnement hostile.
| Fichier | Description |
|---|---|
specs/protocol_sharding.md |
Spécification technique du découpage Reed-Solomon. |
concepts/semantic_polymerase.md |
Architecture du pipeline d'ingestion (Helicase). |
craid.md |
Vue d'ensemble de la topologie Kuramoto. |
FORMULAS.md |
Preuves mathématiques de la résilience. |
"Un souvenir partagé est un souvenir qui ne peut pas mourir."