Fine-Tuning Experiments (LoRA/QLoRA)

Semi-hands-on configs and scripts for fine-tuning open-weight LLMs. Nội dung bán thực hành: config & script cho fine-tuning LLM open-weight.

⚠️ Work in progress. Small configs first, real runs later.

Goals

Minimal LoRA/QLoRA config with PEFT.
Reproducible train/eval commands.
Keep GPU memory modest (8–24GB target).

Layout

configs/ – YAML configs (model, LoRA ranks, train args).
scripts/ – train/infer helpers.
data/ – tiny demo JSONL (placeholder).
logs/ – example training logs (truncated).

Quick Start (conceptual)

# install
pip install transformers peft accelerate datasets bitsandbytes

# dry-run (conceptual)
python scripts/train_lora.py --config configs/lora-llama3-8b.yaml

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
configs		configs
data		data
logs		logs
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
notes.md		notes.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Fine-Tuning Experiments (LoRA/QLoRA)

Goals

Layout

Quick Start (conceptual)

About

Uh oh!

Releases

Packages

Languages

License

Blue-No1/fine-tuning-experiments-v2

Folders and files

Latest commit

History

Repository files navigation

Fine-Tuning Experiments (LoRA/QLoRA)

Goals

Layout

Quick Start (conceptual)

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages