短文本自动生成技术研究进展
张晨阳,杜义华

A Survey on Short-text Generation Technology
ZHANG Chenyang,DU Yihua
表1 四类模型优势及不足对比
Table 1 Comparison of advantages and disadvantages of the four models
模型 优势与不足
Seq2Seq 优势:能够处理输入输出序列不等长问题。
不足:存在暴露偏差,训练和测试量度存在不一致问题。
VAE 优势:有天然的能解决文本生成单一问题的能力。
不足:存在固有的KL散度消失的问题。
GAN 优势:生成判别模式能通过多次迭代生成以假乱真的数据。
不足:判别器难训练。
Transformer 优势:基于注意力机制,能更好的捕捉数据间的关系,生成质量高。
不足:模型复杂度高,尤其在处理长序列数据时。