10.13266/j.issn.0252-3116.2014.19.003
基于语义角色标注的专利主题提取研究
主题自动提取对于专利文献的信息挖掘具有重要的意义.引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式.为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值.
语义角色标注、简化句、主题抽取、专利文献
TP391(计算技术、计算机技术)
本文系国家自然科学基金项目“面向专利文献的统计机器翻译语境分析”项目编号:61303152和中日国际合作项目“面向科技文献的日汉双向实用型机器翻译合作研究”项目编号:2014DFA11350研究成果之一.
2014-11-17(万方平台首次上网日期,不代表论文的发表时间)
19-24