-
Notifications
You must be signed in to change notification settings - Fork 5.6k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
基于paddle的lstm-crf实体识别模型训练效果很差? #5459
Comments
我之前有跑过这个,不过当初chunk evaluator还不能用用的是sum evaluator(token预测的准确率),找了下之前的log,500个pass后token预测的错误率在0.0008054178906604648 |
感觉虽然0.0008054178906604648是以token评估的,但放在chunk里也比较低了,另外方便把你在Paddle和TensorFlow上的实现贴下么 |
这个具体再看下吧。我可以确定的是Paddle 的NER模型是可以跑出 state of art 的结果,我们有训练好的模型。可能是一些细节有问题。 |
TensorFlow是参考这个: paddle是参考的这个: 在相同的公开数据集上conll2003,采用的glove预训练词向量,TensorFlow上训练一个pass就能有不错的结果,目前我用paddle训练了500个pass依然没达到 state of art 的结果(召回很低),我感觉即使最终能达到 state of art 的结果那收敛上是不是也有问题,采用的都是adam优化算法 同样我在自己领域的数据集上也做了实验,发现类似的情况,Paddle实现的模型召回很低,但TensorFlow上能很快收敛,在测试集上达到不错的效果。 评估我用了统一的评估方式,都是基于chunk的方式: |
看了一下这两个模型的结构细节不一样,我们自己跑一下 Conll2003 NER 任务看一下吧~ |
好的,非常谢谢 @lcy-seso 辛苦有结果了同步一下 |
@lcy-seso 问下你们在conll2003 ner任务上跑出结果了么? |
@utopiar models里NER的这个模型上次之后有过调整并且还在调优,可以先用这个试下 PaddlePaddle/models#504 ,差不多会有这样的效果
|
请问有人对比过paddle实现的lstm-crf的ner模型和TensorFlow实现的吗?我用paddle models里提供的sequence_tagging_for_ner demo在conll2003数据集上训练了500个pass结果得到的F1只有50%多(准确率95%以上,召回很低大概40%左右),但是用TensorFlow实现的跑了一个pass就能得到state of the art的结果(准召都在90%以上);是我用paddle实现的模型有问题吗?请教下paddle相关的同学在ner任务上达到过目前最好结果吗?
The text was updated successfully, but these errors were encountered: