#

visual-instruction-tuning

Here are 11 public repositories matching this topic...

BradyFU / Awesome-Multimodal-Large-Language-Models

✨✨Latest Advances on Multimodal Large Language Models

multi-modality instruction-following in-context-learning large-language-models chain-of-thought instruction-tuning visual-instruction-tuning large-vision-language-model multimodal-instruction-tuning large-vision-language-models multimodal-large-language-models multimodal-in-context-learning multimodal-chain-of-thought

Updated Oct 29, 2024

zjysteven / lmms-finetune

A minimal codebase for finetuning large multimodal models, supporting llava-1.5/1.6, llava-interleave, llava-next-video, llava-onevision, qwen-vl, qwen2-vl, phi3-v etc.

finetuning multimodal vision-language foundation-models instruction-tuning large-language-model llava visual-instruction-tuning multimodal-large-language-models large-multimodal-models qwen-vl llava-next

Updated Oct 22, 2024
Python

fraction-ai / GAP

Gamified Adversarial Prompting (GAP): Crowdsourcing AI-weakness-targeting data through gamification. Boost model performance with community-driven, strategic data collection

ai computer-vision artificial-intelligence vqa web3 vqa-dataset llm visual-instruction-tuning

Updated Oct 10, 2024
Python

bigai-nlco / VideoTGB

[EMNLP 2024] A Video Chat Agent with Temporal Prior

spatial-temporal video-language llm mllm visual-instruction-tuning multimodal-large-language-models

Updated Sep 30, 2024
Python

CircleRadon / Osprey

[CVPR2024] The code for "Osprey: Pixel Understanding with Visual Instruction Tuning"

sam mllm visual-instruction-tuning pixel-understanding

Updated Aug 5, 2024
Python

zjr2000 / REVERIE

[ECCV2024] Reflective Instruction Tuning: Mitigating Hallucinations in Large Vision-Language Models

dataset rationale vision-language visual-instruction-tuning multimodal-large-language-models

Updated Jul 17, 2024
Python

hllj / Vistral-V

Vistral-V: Visual Instruction Tuning for Vistral - Vietnamese Large Vision-Language Model.

open-source vietnamese language-model vision-language-model visual-instruction-tuning vistral-v

Updated Jul 1, 2024
Python

yueying-teng / generate-language-image-instruction-following-data

Mistral assisted visual instruction data generation by following LLaVA

mistral multimodal-learning llm langchain llava vllm visual-instruction-tuning llama-cpp-python instruction-following-data

Updated Jun 5, 2024
Python

BAAI-DCAI / DataOptim

A collection of visual instruction tuning datasets.

llm mllm visual-instruction-tuning

Updated Mar 14, 2024
Python

jingyi0000 / Awesome-Visual-Instruction-Tuning

Visual Instruction Tuning towards General-Purpose Multimodal Model: A Survey

survey visual-instruction-tuning multi-modal-model multi-modal-language-model

Updated Feb 16, 2024

ChenDelong1999 / polite-flamingo

🦩 Visual Instruction Tuning with Polite Flamingo - training multi-modal LLMs to be both clever and polite! (AAAI-24 Oral)

large-language-models visual-instruction-tuning multimodal-large-language-models

Updated Dec 9, 2023
Python

Improve this page

Add a description, image, and links to the visual-instruction-tuning topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the visual-instruction-tuning topic, visit your repo's landing page and select "manage topics."