面向中文专利SAO结构抽取的文本特征比较研究
针对中文专利文本中SAO结构实体关系抽取问题,使用支持向量机的机器学习方法进行关系抽取实验,分别对基本词法信息、实体间距离信息、最短路径闭包树句法信息以及词向量信息等特征的有效性进行验证分析.实验结果表明,基本的词法信息能够明显提高关系抽取性能,而句法信息没有显著提高关系抽取效果.此外,也验证了词向量在SAO结构关系抽取中的可行性.
SAO结构、关系抽取、特征有效性、词向量
51
TP391(计算技术、计算机技术)
国家“十二五”科技支撑计划项目2012BAH14F00
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
349-356