模型合并

Jump to bottom

Pengxiao Song edited this page May 13, 2023 · 2 revisions

由于 LLaMA 和 Chinese-LLaMA 没有开源模型权重。根据相应开源许可，本项目只能发布 LoRA 权重，无法发布完整的模型权重，请各位谅解。

Legal-Base-7b 模型基于 Chinese-LLaMA-7B 模型进行二次预训练，得到模型的具体步骤如下。

1. 获取 Chinese-LLaMA-7B 原版模型权重

首先，需要获得 Chinese-LLaMA-7B 的原版模型权重。以下是一些可供参考的获取方式：

手动合并：根据 Chinese-LLaMA 官方文档提供的合并步骤，手动合并模型权重
检索下载：在 Hugging Face 官网模型检索

将模型权重文件夹移动至 models/base_models 目录下，如 models/base_models/chinese-llama-7b-merged

2. 获取 legal-lora-7b 模型权重

其次，下载 legal-lora-7b 模型权重，

将模型权重文件夹移动至 models/lora_weights 目录下，如 models/lora_weights/legal-lora-7b

3. 运行合并脚本

最后，合并原版 Chinese-LLaMA-7B 模型权重和二次训练到的 legal-lora-7b 权重：

sh scripts/merge.sh