VisionAI - Assistive Vision System

Overview

VisionAI is a privacy-focused assistive technology prototype developed in late 2023 (now published for reference, educational and archival purposes) to help visually impaired individuals and those with Alzheimer's disease. The system processes visual input locally to provide contextual understanding and answer user queries without relying on cloud services.

Key Features

🕶️ Real-time visual perception pipeline
🔒 100% local processing - no data leaves the device
🧠 Context-aware memory buffer system
🛡️ Privacy-first architecture
🤖 Multi-stage AI processing pipeline

Technical Components

Computer Vision Stack

YOLOv8 Object Detection - Identects and segments objects in visual feed
CLIP Embeddings - Creates semantic representations of visual data
Image Quality Analysis - Selects clearest frames from camera feed

Memory System

Short-term Buffer: Stores recent object detections and embeddings
Semantic Search: CLIP-based similarity matching for contextual recall
Multi-modal Storage: Combines visual embeddings with text descriptions

Language Processing

Visual Question Answering - Custom LLM integration for image understanding
Contextual Reasoning - Combines memory buffer data with user queries
Privacy-Preserving Architecture - No external API calls or cloud processing

Workflow

flowchart TD
    A[Camera Feed] --> B{Frame Capture}
    B --> C[Image Quality Analysis]
    C --> D[YOLOv8 Segmentation]
    D --> E[CLIP Embedding Generation]
    E --> F[Memory Buffer]
    F --> G[User Query]
    G --> H[Context Retrieval]
    H --> I[Multi-modal LLM Processing]
    I --> J[Final Response]

Deployment Considerations

⚠️ System Requirements:

NVIDIA GPU recommended for real-time processing
Python 3.10+ with PyTorch
Local model weights for YOLOv8 and CLIP

🔧 Configuration:

Install dependencies from requirements.txt
Place model weights in /Models directory
Configure camera settings in CaptureImage.py

Project Status

This repository preserves the 2023 prototype system for technical reference and educational purposes. Researchers/developers should note:

Historical AI/ML implementation patterns
Early-stage privacy preservation techniques
Foundational architecture decisions

A redesigned v2.0 is currently in development with:

Improved memory management
Enhanced visual processing pipeline
Expanded accessibility features

Ethical Considerations

Developed with a focus on:

User privacy protection
Assistive technology accessibility
Transparent AI decision making

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Data		Data
Models		Models
Modules		Modules
Tests		Tests
TopLevel		TopLevel
.gitattributes		.gitattributes
.gitignore		.gitignore
Readme.md		Readme.md
Struct.txt		Struct.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VisionAI - Assistive Vision System

Overview

Key Features

Technical Components

Computer Vision Stack

Memory System

Language Processing

Workflow

Deployment Considerations

Project Status

Ethical Considerations

About

Uh oh!

Releases

Packages

Languages

VedankPurohit/VIsionAI

Folders and files

Latest commit

History

Repository files navigation

VisionAI - Assistive Vision System

Overview

Key Features

Technical Components

Computer Vision Stack

Memory System

Language Processing

Workflow

Deployment Considerations

Project Status

Ethical Considerations

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages