这是针对 DUFL2025 (NLPCC 2025) 共享任务2的最终提交版本代码和结果。
主要特性:
- 赛道一 (Track 1): 作文切题度自动评分
- 采用基于
deepseek-chat
的 LLM 多智能体框架,结合基于bert-base-chinese
的无监督训练 BERT 辅助模块。 - 实现了冲突仲裁机制以解决 LLM 和 BERT 的预测分歧。
- 最终输出符合官方格式的
DUFL2025_track1.json
文件。
- 采用基于
- 赛道二 (Track 2): 相关性评论自动生成
- 采用基于
qwen-max
的多阶段 LLM 智能体流水线。 - 严格依赖 Track 1 的分类结果。
- 强制评论内容聚焦于“切题度”和“中心思想”。
- 严格控制评论长度在 120-190 字符之间 (根据代码实现)。
- 包含 Few-Shot 引导、缓存和备用评论容错机制。
- 最终输出符合官方格式的
DUFL2025_track2.json
文件。
- 采用基于
包含文件:
track1.ipynb
: 赛道一实现代码。track2.ipynb
: 赛道二实现代码。requirements.txt
: 项目依赖。DUFL2025_Method_Report(最高版本).md
: 详细方法报告。README.md
: 项目说明文件。- (以及其他支持文件如
samples.json
,Task Guideline.md
等)
比赛结果:
- 在官方评测中获得 Rank 4,总分 0.6854 (Track1: 0.7784, Track2: 0.6235)。
运行说明:
- 请参考
README.md
中的 "使用流程" 部分进行环境配置和代码运行。 - 注意:运行代码需要配置有效的 LLM API 密钥,并可能需要较长的运行时间。Track 1 的 BERT 模块训练需要 GPU 支持。