10.19678/j.issn.1000-3428.0054895
基于通配符模式与随机游走的关键词提取方法
结合通配符模式与引入先验信息的随机游走算法,提出一种改进的关键词提取方法.使用通配符约束捕获词语之间的语义关系,提取满足间隙约束和一次性条件的顺序模式以计算模式支持度,并在模式支持度大于等于最小支持度阈值时建立节点关联图.将维基百科知识库中词语间的相似度作为先验信息,利用基于先验信息的PageRank算法在关联图上进行随机游走直至其排名分数趋于稳定,选取排名前Top K个词语作为关键词.实验结果表明,与TextRank、GraphSum算法相比,该方法具有更高的提取准确率及稳定性.
提取、通配符模式、随机游走、间隙约束、PageRank算法
46
TP18(自动化基础理论)
国家自然科学基金;甘肃省高等学校创新基金;广西可信软件重点实验室研究课题;西北师范大学青年教师科研能力提升计划
2020-07-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
78-83