Skip to content

Conversation

@Yuanhong-Zheng
Copy link
Contributor

增加了VideoCoTQA的Pipeline, 具体描述在飞书文档中, 同时规范了原来一些视频算子的文件名等(功能没有改变).

@haolpku
Copy link
Contributor

haolpku commented Dec 3, 2025

  1. 不要传太大的图片/视频上来
  2. 自动测试环境问题
  3. 不要在算子加测试代码
  4. 算子里不build prompt
  5. pipeline/算子抽象

@Yuanhong-Zheng
Copy link
Contributor Author

Yuanhong-Zheng commented Dec 6, 2025

已更新

  1. 避免太大内容的上传
  2. 在requirements.txt中增加了clip
  3. 删除算子的测试代码
  4. 将prompt单独写在prompts/video.py中
  5. 一个CoT data generate Pipeline使用三个算子.(具体见飞书)

@Yuanhong-Zheng
Copy link
Contributor Author

在原来的基础上修改了prompt_vqa的逻辑以及bug:

  1. 在只支持输入prompt的基础上加入conversation, 且不影响原来的功能;
  2. 原来只能在image上用, 加入了video(原来有bug);
  3. 原来的一个batch的样本必须全为image或者全为video, 现在一个batch的每个样本可以为image或者video.

@haolpku haolpku merged commit 60266f8 into OpenDCAI:main Dec 11, 2025
9 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants