10.16208/j.issn1000-7024.2019.02.017
基于三元组文档表示的文本分类
为解决现有文档表示方法中不包含结构特征以及难以融入外部知识的问题,提出基于三元组的文档表示方法,并结合分布式向量语义表示.基于三元组的文档表示方法的另一个优势是可以非常方便地融入词向量特征,扩展三元组的语义表示.该方法在完全相同且不使用外部知识的实验设置下,能显著提升文本分类的性能;当词向量特征被利用后,文本分类性能增强了约0.8%;当融入自动抽取的外部背景三元组知识后,进一步带来了1.2%的性能提升.
文档表示、文本分类、分布式语义、三元组、外部知识
40
TP391(计算技术、计算机技术)
CCF中文信息技术开放基金项目CCF2014-02-02
2019-05-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
394-398