PaddleNLP提供了丰富的模型结构,包含经典的RNN类模型结构,与Transformer类模型及其预训练模型。
模型 | 简介 |
---|---|
BiGRU-CRF | BiGRU-CRF是一个经典的词法分析模型,可用于中文分词、词性标注和命名实体识别等任务。 |
BoW | 最基础的序列特征提取模型,对序列内所有词向量进行线性求和或取平均的操作。 |
RNN/Bi-RNN | 单/双向RNN序列特征提取器,是变种的LSTM结构,计算量相比LSTM较少。 |
LSTM/Bi-LSTM | 单/双向LSTM序列特征提取器。 |
TextCNN | Convolutional Neural Networks for Sentence Classification |
LSTM/Bi-LSTM with Attention | 带注意力机制的单/双向LSTM特征提取器。 |
GRU/Bi-GRU | 单/双向GRU序列特征提取器,是变种的LSTM结构,计算量相比LSTM较少。 |
TCN | TCN(Temporal Convolutional Network)模型基于卷积的时间序列模型,通过因果卷积(Causal Convolution)和空洞卷积(Dilated Convolution) 特定的组合方式解决卷积不适合时间序列任务的问题,TCN具备并行度高,内存低等诸多优点,在某些时间序列任务上效果超过传统的RNN模型。 |
RNNLM | Recurrent neural network based language model,RNN/LSTM等结构的经典语言模型。 |
ELMo | Embedding from Language Model(ELMo), 发表于NAACL2018的动态词向量开山之作。 |
SimNet | SimNet是百度自研的文本匹配计算的框架,主要包括 BOW、CNN、RNN、MMDNN 等核心网络结构形式,已在百度各产品上广泛应用。 |
LSTM Seq2Seq with Attention | 使用编码器-解码器(Encoder-Decoder) 结构, 同时使用了Attention机制来加强Decoder和Encoder之间的信息交互,Seq2Seq 广泛应用于机器翻译,自动对话机器人,文档摘要自动生成,图片描述自动生成等任务中。 |
更多模型应用场景介绍请参考PaddleNLP Example