QA_AutoSummary

1. 项目背景

该项目为百度比赛项目，该项目简介为：本次比赛主题为汽车大师问答摘要与推理。要求使用汽车大师提供的11万条 技师与用户的多轮对话与诊断建议报告 数据建立模型，模型需基于对话文本、用户问题、车型与车系，输出包含摘要与推断的报告文本，综合考验模型的归纳总结与推断能力。

比赛地址为：https://aistudio.baidu.com/aistudio/competition/detail/3

2.项目简介

首先该项目选取seq2seq+attention模型作为baseline，模型文件夹对应seq2seq_model_v2，网络架构图如下：

然后为了解决一下问题:

OOV问题即未登录词问题。
重复生成词问题。

采用PGN网络和coverage机制进行改进，改进的网络架构如下：

改动细节

以上网络框架参考如下论文：

Get To The Point: Summarization with Pointer-Generator Networks

然后参考：

https://github.com/Light2077/QA-Abstract-And-Reasoning

对文件夹PGN_model中layer层中的decoder进行了修改，发现确实能提高很多性能，具体改动可对照PGN_remodel中layer层里的decoder。

运行

在main.py中修改对应的参数即可进行模型的训练和测试，测试采用greedy和beam两种策略。

python main.py

模型效果

最终提交到比赛平台上达到30.4的ROUGE-L评分，如下图：

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
PGN_model		PGN_model
PGN_remodel		PGN_remodel
img		img
seq2seq_model_v2		seq2seq_model_v2
Readme.md		Readme.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

QA_AutoSummary

1. 项目背景

2.项目简介

改动细节

运行

模型效果

About

Releases

Packages

Languages

noobexplore/QA_AutoSummary

Folders and files

Latest commit

History

Repository files navigation

QA_AutoSummary

1. 项目背景

2.项目简介

改动细节

运行

模型效果

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages