Skip to content

关于文本label直接复制input_ids的处理 #38

Open
@Cooperx521

Description

@Cooperx521

作者您好,在documents/pretraining/Causal LM for Continual Pre-training.md里面,有这样一句话输入时只需要直接将input_ids复制一份为label即可,麻烦问一下因为在计算loss的时候,label需要左移一位,那么这个操作是在哪一部分被完成的呢,是在trainer里面吗,可是trainer如何知道是causal loss呢

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions