10.3772/j.issn.1000-0135.2014.09.010
学术文本的结构功能识别功能框架及基于章节标题的识别
当前学术文本挖掘研究大多数是采用基于词汇、窗口、全文的方法,往往忽略了学术文本的内在结构,导致了很多歧义性问题。本文针对当前研究不足,提出一种研究性论文的结构功能框架,对学术文本的章节功能和逻辑结构进行了定义。在此基础上本文从三个不同层次(基于章节标题、基于章节内容和标题、基于段落)论述了结构功能的自动分类问题,并从第一个层次(基于章节标题)采用词表与序列标注相结合的方法进行了结构功能的自动分类实验,取得了令人满意的效果。
文本挖掘、结构功能、自动分类
G2 ;TP3
国家自然科学基金面上项目“基于语言模型的通用实体检索建模及框架实现研究项目编号71173164;教育部人文社会科学基地重大项目“面向细粒度的网络信息检索模型及框架构建研究项目编号10JJD630014的研究成果之一。
2015-04-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
979-985