To Err Is Human, but Llamas Can Learn It Too

Fine-tuning Llama for GEC

This repository contains the fine-tuning, inference and data formating scripts for fine-tuning and continued-pretraining of Llama-2 for GEC.

See scripts/gec for example scripts.

Models

Models for GEC trained on 1M Llama-generated errors, then gold errors:

Estonian: tartuNLP/Llammas-base-p1-llama-errors-p2-GEC
Ukrainian: tartuNLP/Llamma-2-7b-ukr-p1-llama-errors-p2-GEC
German: tartuNLP/leo-hessianai-7b-p1-llama-errors-p2-GEC

Models for AEG (artificial error generation):

Synthetic data generated with AEG models: tartuNLP/aeg-data.

You can also find all the models in our HuggingFace collection

Citation

@misc{luhtaru2024errhumanllamaslearn,
      title={To Err Is Human, but Llamas Can Learn It Too}, 
      author={Agnes Luhtaru and Taido Purason and Martin Vainikko and Maksym Del and Mark Fishel},
      year={2024},
      eprint={2403.05493},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2403.05493}, 
}

Acknowledgements

Code originally based on github.com/TartuNLP/llammas.

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
scripts/gec		scripts/gec
.gitignore		.gitignore
README.md		README.md
batch_instruction_inference.py		batch_instruction_inference.py
finetune.py		finetune.py
inference_datasets.py		inference_datasets.py
requirements.txt		requirements.txt
training_datasets.py		training_datasets.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

To Err Is Human, but Llamas Can Learn It Too

Models

Citation

Acknowledgements

About

Releases

Packages

Contributors 2

Languages

TartuNLP/gec-llm

Folders and files

Latest commit

History

Repository files navigation

To Err Is Human, but Llamas Can Learn It Too

Models

Citation

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages