Skip to content

关于readme所述的目录配置与代码实际运行情况不匹配的问题 #406

@Moeus

Description

@Moeus

我在尝试使用MUGE数据集复现模型的过程中发现了bash脚本和代码的对于路径处理的问题。下图是readme中推荐的工作目录以及在该工作目录下运行微调的命令,
Image

Image

在按照要求配置目录和命令时出现了以下问题,
Image

代码中处理数据导入到部分发生了assert报错,报错显示是数据集路径存在问题,也就是说,你们推荐的运行方式是错误的。
经过我的排查,发现了报错的原因
在启动训练的bash脚本中,我发现,脚本将cn_clip加入模块搜索路径,并且启动cn_clip/training下的main.py,这是程序的入口。
Image

此时,整个程序的运行目录应该是在“Chinese-CLIP”目录,也就是数据集的同级目录,然而在导入数据的代码中,没有对目录进行任何修改
Image

此时是在“Chinese-CLIP”目录下搜索数据集,然而数据集与“Chinese-CLIP”同级,这就导致了报错。
为此,我给出的方案是,修改bash脚本,在引用可${DATAPATH}变量前都加入“../”,这能使得在代码运行时去上一级目录搜索数据集,而不是在工作目录下搜索数据集导致报错。
Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions