10.3969/j.issn.1004-8626.2016.04.013
基于改进TextRank的关键词抽取算法
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法———TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。
TextRank-CM算法、TextRank算法、G1赋权法、关键词抽取
24
TP391(计算技术、计算机技术)
北京市教育委员会PXM2016_014223_000025;北京印刷学院重点项目r1512000570
2016-09-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
51-55