BasicRAG, Google'ın Gemini 1.5 Flash modelini ve LangChain kütüphanesini kullanarak, PDF ve metin belgelerinizden anlamlı bilgiler çıkaran bir Retrieval-Augmented Generation (RAG) sistemidir.
- ⚡ Gemini 1.5 Flash Entegrasyonu: Düşük gecikme süresi ve yüksek doğrulukla metin üretimi.
- 📚 Gelişmiş Doküman İşleme: PDF dosyalarını parçalara ayırıp (chunking) vektör uzayına taşıma.
- 🔍 Semantik Arama: Sorularınıza sadece anahtar kelimeyle değil, cümlenin anlamıyla cevap bulur.
- 🧠 Hafıza Desteği: Konuşmanın geçmişini hatırlar ve takip sorularına cevap verebilir.
Sistem temel olarak şu adımları izler:
- Ingestion: PDF/Text dokümanları okunur.
- Splitting: Uzun metinler küçük, anlamlı parçalara bölünür.
- Embedding: Her parça, Google'ın embedding modelleri ile vektörlere (sayısal dizilere) dönüştürülür.
- Retrieval: Sorunuzla en alakalı metin parçaları vektör veritabanından çağrılır.
- Generation: Gemini (ya da OpenAI), bu parçaları kullanarak size en doğru yanıtı verir.
git clone [https://github.com/mel-ektron/basicrag-term-project.git](https://github.com/mel-ektron/basicrag-term-project.git)
cd basicrag-term-project
## Proje Akışı
basicrag-term-project/
├── 🐍 main.py # Başlatıcı dosya
├── 🐍 rag_engine.py # RAG
──── gemini_basic_rag.ipnyb
──── openai_basic_rag.ipynb
├── 📂 data/ # PDF ve dökümanların saklandığı klasör
├── 📄 .env # API Key (Gizli tutulmalıdır)
├── 📄 requirements.txt # Gerekli paketler
└── 📄 README.md # Proje dökümantasyonu