10.3772/j.issn.1673-2286.2016.8.007
基于引文上下文的学术文本自动摘要技术研究
学术文本自动摘要是指对于给定学术文献,自动地抽取其核心内容,以提高用户撰写和阅读文献的效率。目前基于文本词频对句子重要性排序的自动摘要技术,无法从语义层面揭示学术文本的核心内容。本文在已有研究的基础上,引入引文上下文内容特征,并通过构建支持向量回归模型,综合考虑自动摘要系统中的各个特征对句子权重的影响,重新对句子重要性进行排序。基于WE-ROUGE的评测表明,相比于传统基于词频统计和图模型的方法,本文提出的算法能够有效提升自动摘要的准确度。
文本自动摘要、引文上下文、支持向量回归、词向量
G353.4(情报学、情报工作)
国家自然科学基金面上项目“面向词汇功能的学术文本语义识别与知识图谱构建”编号71473183资助。
2016-09-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
43-49