10.3772/j.issn.1000-0135.2016.004.009
学术文本的结构功能识别——在学术搜索中的应用
在学术大数据环境下,学术文本挖掘研究向细粒度和语义化方向发展.学术文本的结构功能是对学术文本正文的结构及章节功能的概括.为探讨结构功能在学术搜索中的作用,本文将学术文本看作是个结构功能域的集合,使用域加权语言模型对学术文本结构功能进行加权,并以一般语言模型为基准,在INEX04数据上进行了文档级检索实验.实验结果表明本文所提出的模型取得了较大的提升,尤其在P@5上的相对提升达到13.93%.根据模型中各个结构功能域的权重参数分析可以得知,引言功能作用最大,相关研究、方法的作用次之,实验及结论的作用最小.本文的实验也证明了学术文本的结构功能在学术搜索中的应用价值.
结构功能、学术搜索、域加权、语言模型
35
R65;S76
国家自然科学基金面上项目“面向词汇功能的学术文本语义识别与知识图谱构建”71473183;武汉大学与中国科技信息研究所合作项目“科学文献的语义功能识别与深度利用”研究成果之一
2016-10-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
425-431