10.3969/j.issn.1672-9722.2022.03.012
融合信息熵的TextRank关键词抽取方法
将信息熵融入TextRank算法中分词器部分以改善关键词抽取的准确度.在分词前,先用信息熵的方式提取文章的关键新词,加入到分词字典中,使分词器能够自主识别新词,以增强文章关键词提取的准确性.当语料中存在新词的时候,关键词抽取准确度效果提升明显,对不存在新词的语料关键词抽取准确度无明显提升.改善分词效果可以提升关键词抽取准确度.
抽取、信息熵、TextRank
50
G254.23(图书馆学、图书馆事业)
国家安全高精尖学科建设科研专项学校基金2019GA37
2022-04-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
516-519,579