作者:杨夕
项目地址:https://github.com/km1994/nlp_paper_study
个人介绍:大佬们好,我叫杨夕,该项目主要是本人在研读顶会论文和复现经典论文过程中,所见、所思、所想、所闻,可能存在一些理解错误,希望大佬们多多指正。
判别模型是直接对P(Y|X)建模,就是说,直接根据X特征来对Y建模训练。
- 对P(Y|X)建模;
- 对所有的样本只构建一个模型,确认总体判别边界;
- 观测到输入什么特征,就预测最可能的label;
对数据量要求没生成式的严格,速度也会快,小数据量下准确率也会好些。
在模型训练中,我学习到的是X与Y的联合模型 P(X,Y) ,也就是说,我在训练阶段是只对 P(X,Y) 建模,我需要确定维护这个联合概率分布的所有的信息参数。完了之后在inference再对新的sample计算 P(Y|X) ,导出 Y,但这已经不属于建模阶段了。
- 1.对 P(X,Y) 建模;
- 这里我们主要讲分类问题,所以是要对每个label( yi)都需要建模,最终选择最优概率的label为结果,所以没有什么判别边界。(对于序列标注问题,那只需要构件一个model);
- 中间生成联合分布,并可生成采样数据。
所包含的信息非常齐全,我称之为“上帝信息”,所以不仅可以用来输入label,还可以干其他的事情。生成式模型关注结果是如何产生的。
但是生成式模型需要非常充足的数据量以保证采样到了数据本来的面目,所以速度相比之下较慢。