10.3969/j.issn.1000-3428.2012.03.062
基于关键词抽取的自动文摘算法
针对生成文摘内容不完整的问题,利用相邻词的共现频率进行未登录词识别,提出一种通过词汇链的构建进行中文关键词抽取和文摘生成的算法,并给出一种采用《知网》为知识库构建词汇链的方法.通过计算词义相似度构建词汇链,结合词汇所在词汇链的强度、信息熵和出现位置等属性,进行关键词抽取和句子重要度计算.实验结果表明,与已有算法相比,该算法能够提高生成摘要的召回率和准确率.
自动文摘、向量空间模型、关键词抽取、词汇链、未登录词识别
38
TP18(自动化基础理论)
北京市优秀人才培养资助专项科研基金资助项目2009D005001000005
2012-06-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
183-186