10.3772/j.issn.1000-0135.2021.08.006
基于语义文本图的论文摘要关键词抽取算法
鉴于关键词对大规模文献检索和文本内容分析的基础作用,本文提出了一种基于语义文本图的无监督关键词抽取算法,重点对传统基于图(graph-based)方法中的文本图构建和词加权方式进行改进.为了使文本图保留更多的语义和结构信息,算法根据单词在句子中的语义依存关系,生成由概念连接、等价隶属、功能属性和修饰限定四种属性边构成的语义文本图,省去传统图生成方法中所需要的窗口长度参数设定.在此基础上,本文提出融合关键词位置信息、概念层级和连接强度的词权重计算方法,并对词语的重要性排序,最终选择高得分节点构成摘要文本的关键词集合.在四个开放语料上的实验结果显示,本文提出的方法抽词效果优于其他三个同类baseline算法,F1值最高为0.570.
文本图;关键词抽取;词加权;句法解析
40
国家社会科学基金重大项目"基于数据共享与知识复用的数字政府智能化治理研究"20ZDA039
2021-09-14(万方平台首次上网日期,不代表论文的发表时间)
共15页
854-868