DOI：10.3969/j.issn.1007-130X.2019.01.021

基于Wasserstein GAN的文档表示模型

引用

摘要：

文档表示模型可以将非结构化的文本数据转化为结构化数据,是多种自然语言处理任务的基础,而目前基于词的模型在文档表示任务中有着无法直接表示文档的缺陷.针对此问题,基于生成对抗网络GAN可以使用两个神经网络进行对抗学习,从而很好地学习到原始数据分布的特点,提出了文档表示模型WADM,使用去噪自编码器作为其判别网络,由其隐层直接得到文档的分布表示.实验表明,WADM能够准确抽取文档特征,相比基于词的模型具有更强的文档表示能力.

关键词：文档表示、生成对抗网络、去噪自编码器、神经网络

所属期刊栏目：41

分类号：TP391(计算技术、计算机技术)

资助基金：天津市科技计划项目17KPXMSF00140;天津市教委社科重大项目2017JWZD19

在线出版日期：2019-03-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：161-165

英文信息展示

期刊专题