10.3969/j.issn.1000-3428.2016.02.031
基于词向量的中文词汇蕴涵关系识别
英文词汇蕴涵关系识别已有较多研究,并提出许多识别模型,但针对中文的词汇蕴涵关系获取则鲜有研究.为此,提出一种中文词汇蕴涵关系识别方法.利用词向量技术,在中文维基百科语料上进行训练,将词汇表示为词向量,设计各种基于词向量的分类特征,训练得到可用于名词词汇蕴涵关系分类的支持向量机分类模型.实验结果表明,与传统的余弦相似度方法相比,该方法以及设计的各种分类特征在词汇蕴涵关系识别方面具有明显优势.
文本蕴涵、词汇蕴涵、词向量、蕴涵特征、支持向量机
42
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61163039,61163036,61363058;西北师范大学青年教师科研能力提升计划基金资助项目NWNU-LKQN-10-2,NWNU-LKQN-12-23
2016-05-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
169-174