改进的关键词抽取方法研究
在关键词抽取方法研究中,提出了多步骤的,针对任意领域的文本关键词抽取方法.该方法采用多元文法进行候选关键词抽取,提出了基于语言学特征的扩展tf/idf关键词的加权计算方法,以及能够抽取未登录词的关键词的方法和对关键词抽取进行优化的策略.首次提出了用支持向量机对最后的抽取结果进行优化.实验结果表明,该方法与单纯的tf/idf算法相比,具有更高的查准率和查全率.
关键词抽取语言学特征、特征拟合、多元文法、支持向量机
30
TP391(计算技术、计算机技术)
国家973重点基础研究发展计划基金项目2007CB613507
2009-12-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
4677-4680,4769