Oscar

Scripts for to inference using Oscar in Image Captioning and VQA tasks

Requirements

For inference One Image
Minimum VRAM = 6GB, You must run 'torch.cuda.empty_cache()' to flush gpu cache at every inference
Recommemd VRAM = 7GB or more

Demo

To Know How to use Oscar models see *.ipynb

Results

Image Captioning

GQA

Notice

Since scene_graph_benchmark repo, the vinvl encoder only support default cuda.
So if you want to use other cuda device.
You must change default cuda.
Insert the code below on your code.

import os
os.environ['CUDA_VISIBLE_DEVICES']='1'

MODEL ZOO

Image Captioning

Task	BLEU-1	BLEU-2	BLEU-3	BLEU-4	CIDEr
Ours+B(XE)	72.7	54.6	36.9	23.0	118.0
Ours+L(XE)	72.9	54.92	37.4	23.7	118.0
Ours+B(CIDEr)	76.9	59.7	41.6	25.6	128.6
Ours+L(CIDEr)	76.8	59.7	41.8	25.9	128.6
Oscar+	-	-	-	41.0	140.9

GQA

Task	ACC
Ours+	58.1
Oscar+	64.7

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
Oscar @ 423997b		Oscar @ 423997b
decoder		decoder
encoder		encoder
figures		figures
py-bottom-up-attention @ 990983b		py-bottom-up-attention @ 990983b
scene_graph_benchmark @ 2df1912		scene_graph_benchmark @ 2df1912
.gitignore		.gitignore
.gitmodules		.gitmodules
CITATION.cff		CITATION.cff
LICENSE		LICENSE
README.md		README.md
vinvl_GQA.ipynb		vinvl_GQA.ipynb
vinvl_IC.ipynb		vinvl_IC.ipynb
vinvl_VQA.ipynb		vinvl_VQA.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Oscar

Requirements

Demo

Results

Image Captioning

GQA

Notice

MODEL ZOO

Image Captioning

GQA

About

Releases 1

Packages

Languages

License

Alcoholrithm/Oscar_Scripts

Folders and files

Latest commit

History

Repository files navigation

Oscar

Requirements

Demo

Results

Image Captioning

GQA

Notice

MODEL ZOO

Image Captioning

GQA

About

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages