注意事项

peft 需要安装指定版本，可以安装本地版本（peft-main）
- 同时要根据自己模型的不同特点选择不同的target_modules=[xxx]
- modules_to_save：除了lora部分之外，还有哪些层可以被训练，并且需要保存
模型中的get_position_ids 需要改成 context_length = len(seq)
模型中的padding与以往方式不同
- 原有格式为 [que] + [reply]
- 需要改为 [que + [tokenizer.mask_token_id]] + [pad_token]*n + [ [tokenizer.bos_token_id]+ reply + [tokenizer.eop_token_id]]
模型中只允许bs为1进行训练，如果想多bs需要自行修改代码，已修改好

各个文件

请提前下载好chatglm-6b权重，参考[https://huggingface.co/THUDM/chatglm-6b]，放在model文件夹下！函数不要进行修改
运行train.py即可
- 可以指定多gpu进行模型并行，可以根据模型大小设置不同的batch_size，但是无法进行数据并行
- 参考：8卡batch_size为4，每张卡10G