10.13266/j.issn.0252-3116.2015.09.011
面向中国专利文献的零形回指消解规则研究
[目的/意义]面对海量专利文献,如何使用户快速、精准地掌握知识,是优化专利服务的关键课题.中文专利文献中大量存在的零形回指现象,严重影响了知识的自动识别与提取,但由于专利文献零形回指识别与消解涉及到众多文本分析技术及特定资源建设,因此,目前尚未发现针对性研究.[方法/过程]在物性结构理论、语义角色及修辞结构关系理论的指导下,展开相关规则的研究,开发句法及语义角色标注工具和篇章标注工具两种工具,并构建了4个资源库:①“专利动词物性角色库”,将专利的动词归纳为4类;②“专利知识论元结构库”,用于自动标注专利动词物性角色及其论元结构;③“专利动词论元结构规则库”,用于分析零形回指的先行语;④“零形回指修辞结构类型库”,用于分析当零形回指搭配“功能角色”和“部件角色”的情况.[结果/结论]通过资源库的建设,得出5条消解规则.初步成果已成功应用于机械领域专利文献的自动处理工作.
专利、零形回指、指代消解、物性结构、语义角色、修辞结构理论
G250;TP391(图书馆学、图书馆事业)
本文系中国博士后科学基金“面向专业文献的汉语零形回指消解研究”项目编号:2014M550792和国家科技支撑计划课题“专利信息资源挖掘与发现关键技术研究”项目编号:2013BAH21B02研究成果之一.
2015-07-20(万方平台首次上网日期,不代表论文的发表时间)
73-79,142