Skip to content

Build AI model to classify beverages for blind individuals

License

Notifications You must be signed in to change notification settings

BlindOver/blindover_AI

Repository files navigation

Build Deep Learning Model for blind individuals

ShuffleNetV2 MobileNetV3 MNASNet EfficientNetV2
375,617 1,551,681 5,043,529 20,219,761

Overview

The Pipeline of our Process with simple CNN architecture

Features

  • To avoid image distortion, we apply padding and resize processing.
  • To maximize performance of model on mobile devices, we trained various models such as Efficient, MobileNetV3, ShuffleNetV2 and MNASNet and compare their accuracy and inference speed.
  • To address the issue of insufficient data, we utilize image generation models such as Diffusion and DALL-E to increase the number of samples.

Dataset

Sample images

  • Coca Cola
  • Sprite Zero

Classes

2% (0) 박카스 (1) 칠성 사이다 (2) 칠성 사이다 제로 (3) 초코 우유 (4) 코카 콜라 (5)
데미소다 사과 (6) 데미소다 복숭아 (7) 솔의눈 (8) 환타 오렌지 (9) 게토레이 (10) 제티 (11)
맥콜 (12) 우유 (13) 밀키스 (14) 밀키스 제로 (15) 마운틴듀 (16) 펩시 (17)
펩시 제로 (18) 포카리 스웨트 (19) 파워에이드 (20) 레드불 (21) 식혜 (22) 스프라이트 (23)
스프라이트 제로 (24) 딸기 우유 (25) 비타 500 (26) 브이톡 블루레몬 (27) 브이톡 복숭아 (28) 웰치스 포도 (29)
웰치스 오렌지 (30) 웰치스 화이트그레이프 (31) 제로 콜라 (32) - - -

Directory Guide

path : dataset/
├── images
│    ├─ class 1
│        ├─ img1.jpg
│        ├─ ...
│    ├─ class 2
│        ├─ img1.jpg
│        ├─ ...
│    ├─ class 3
│        ├─ img1.jpg
│        ├─ ...
│    ├─ ...
│        ├─ ...
│        ├─ ...

Install virtual environment in Anaconda

conda create -n blindover python==3.8
conda activate blindover
cd ./blindover_AI
pip install -r requirements.txt

Training

python3 train.py --data_path '{dataset directory}' --name 'exp' --model '{the one of 4 models}' --pretrained --img_size 224 --num_workers 8 --batch_size 32 --epochs 100 --optimizer 'momentum' --lr_scheduling --check_point

Testing

  • Testing model to evaluate the performance in test set
python3 test.py --data_path '{dataset directory}' --model '{the one of 4 models}' --weight './runs/exp/weights/best.pt' --img_size 224 --num_workers 8 --batch_size 32 --num_classes 100

Acknowledgements