Skip to content

This is my first project, which dataset is come from carmasterApp in china

Notifications You must be signed in to change notification settings

noobexplore/QA_AutoSummary

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

QA_AutoSummary

1. 项目背景

该项目为百度比赛项目,该项目简介为:本次比赛主题为汽车大师问答摘要与推理。要求使用汽车大师提供的11万条 技师与用户的多轮对话与诊断建议报告 数据建立模型,模型需基于对话文本、用户问题、车型与车系,输出包含摘要与推断的报告文本,综合考验模型的归纳总结与推断能力。

比赛地址为:https://aistudio.baidu.com/aistudio/competition/detail/3

2.项目简介

首先该项目选取seq2seq+attention模型作为baseline,模型文件夹对应seq2seq_model_v2,网络架构图如下:

seq2seq+att

然后为了解决一下问题:

  • OOV问题即未登录词问题。
  • 重复生成词问题。

采用PGN网络和coverage机制进行改进,改进的网络架构如下:

PGN

改动细节

以上网络框架参考如下论文:

Get To The Point: Summarization with Pointer-Generator Networks

然后参考:

https://github.com/Light2077/QA-Abstract-And-Reasoning

对文件夹PGN_model中layer层中的decoder进行了修改,发现确实能提高很多性能,具体改动可对照PGN_remodel中layer层里的decoder。

运行

在main.py中修改对应的参数即可进行模型的训练和测试,测试采用greedy和beam两种策略。

python main.py

模型效果

最终提交到比赛平台上达到30.4的ROUGE-L评分,如下图:

About

This is my first project, which dataset is come from carmasterApp in china

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages