Skip to content

grpo训练中completions问题 #1433

@wangat

Description

@wangat

功能请求是否与某个问题相关?请描述。

您好,感谢您的工程;
在使用ms-swift框架下使用qwen2.5-vl系列模型做grounding任务训练grpo的时候,因为设置了(gt格式类似[endpoint[,];point[,]],训练中ms-swift会使用<|box_start|>(427,0)<|box_end|>替换),但是在completionsz中没有图片信息/任务id/或者是原来的objects信息,导致无法评估生成效果到底怎么样,想问一下您有没有输出的方法(尝试在训练中打印批次内图片名字并记录,但是发现和completionsz中顺序不一致,一个batch比较大,不好确认)。
使用的swanlab 版本为0.6.10。

描述您希望的解决方案

能否指定其它信息输出。比如objects、或者自己定义的其它字段。

描述您考虑过的替代方案

No response

Metadata

Metadata

Assignees

No one assigned

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions