WebRAG

A Streamlit application for crawling websites or processing PDFs, then answering questions about their content using retrieval-augmented generation.

Features

Crawl websites and index their content
Process PDF documents
Ask questions using similarity search
Generate AI-powered answers via OpenAI
Save and manage multiple indices

Quick Start

# Install dependencies
pip install streamlit faiss-cpu numpy sentence-transformers openai pdfplumber beautifulsoup4 requests

# Run the app
streamlit run webrag-streamlit.py

Usage

Crawl a website or upload a PDF
Ask questions about the content
Get relevant passages and AI-generated answers

Requirements

Python 3.7+
OpenAI API key (for AI answer generation)

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
__pycache__		__pycache__
evaluation		evaluation
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
rag_backend.py		rag_backend.py
requirements.txt		requirements.txt
webrag-streamlit.py		webrag-streamlit.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

Uh oh!

Repository files navigation

WebRAG

Features

Quick Start

Usage

Requirements

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Uh oh!

Uh oh!

Beenaa99/WebRAG

Folders and files

Latest commit

History

Repository files navigation

WebRAG

Features

Quick Start

Usage

Requirements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages