Skip to content

DUFL2025 (NLPCC 2025) 最终提交版本

Latest
Compare
Choose a tag to compare
@goat1ee goat1ee released this 20 Apr 11:51
75858da

这是针对 DUFL2025 (NLPCC 2025) 共享任务2的最终提交版本代码和结果。

主要特性:

  • 赛道一 (Track 1): 作文切题度自动评分
    • 采用基于 deepseek-chat 的 LLM 多智能体框架,结合基于 bert-base-chinese 的无监督训练 BERT 辅助模块。
    • 实现了冲突仲裁机制以解决 LLM 和 BERT 的预测分歧。
    • 最终输出符合官方格式的 DUFL2025_track1.json 文件。
  • 赛道二 (Track 2): 相关性评论自动生成
    • 采用基于 qwen-max 的多阶段 LLM 智能体流水线。
    • 严格依赖 Track 1 的分类结果。
    • 强制评论内容聚焦于“切题度”和“中心思想”。
    • 严格控制评论长度在 120-190 字符之间 (根据代码实现)。
    • 包含 Few-Shot 引导、缓存和备用评论容错机制。
    • 最终输出符合官方格式的 DUFL2025_track2.json 文件。

包含文件:

  • track1.ipynb: 赛道一实现代码。
  • track2.ipynb: 赛道二实现代码。
  • requirements.txt: 项目依赖。
  • DUFL2025_Method_Report(最高版本).md: 详细方法报告。
  • README.md: 项目说明文件。
  • (以及其他支持文件如 samples.json, Task Guideline.md 等)

比赛结果:

  • 在官方评测中获得 Rank 4,总分 0.6854 (Track1: 0.7784, Track2: 0.6235)。

运行说明:

  • 请参考 README.md 中的 "使用流程" 部分进行环境配置和代码运行。
  • 注意:运行代码需要配置有效的 LLM API 密钥,并可能需要较长的运行时间。Track 1 的 BERT 模块训练需要 GPU 支持。