-
Notifications
You must be signed in to change notification settings - Fork 540
Open
Description
我在尝试使用MUGE数据集复现模型的过程中发现了bash脚本和代码的对于路径处理的问题。下图是readme中推荐的工作目录以及在该工作目录下运行微调的命令,

代码中处理数据导入到部分发生了assert报错,报错显示是数据集路径存在问题,也就是说,你们推荐的运行方式是错误的。
经过我的排查,发现了报错的原因
在启动训练的bash脚本中,我发现,脚本将cn_clip加入模块搜索路径,并且启动cn_clip/training下的main.py,这是程序的入口。

此时,整个程序的运行目录应该是在“Chinese-CLIP”目录,也就是数据集的同级目录,然而在导入数据的代码中,没有对目录进行任何修改

此时是在“Chinese-CLIP”目录下搜索数据集,然而数据集与“Chinese-CLIP”同级,这就导致了报错。
为此,我给出的方案是,修改bash脚本,在引用可${DATAPATH}变量前都加入“../”,这能使得在代码运行时去上一级目录搜索数据集,而不是在工作目录下搜索数据集导致报错。

Metadata
Metadata
Assignees
Labels
No labels
