GitHub

This repository is inspired by the article https://openreview.net/pdf?id=KRLUvxh8uaX.
A clear example of how VLM works when changing compositional information is presented. Augmentations for NegCLIP training are realised.

Some useful links:
CLIP model: https://huggingface.co/openai/clip-vit-base-patch32
CTC loss realization: https://github.com/mlfoundations/open_clip/blob/main/src/open_clip/loss.py
Flickr Dataset: https://www.kaggle.com/datasets/hsankesara/flickr-image-dataset
NegCLIP training: https://github.com/vinid/neg_clip

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
data_examples		data_examples
README.md		README.md
augmentations.py		augmentations.py
look_compositional.ipynb		look_compositional.ipynb
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Uh oh!

Releases

Packages

Languages

varyxi/compositional_knowledge_vlms

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages