10.3969/j.issn.1003-0077.2018.03.014
DRTE:面向基础教育的术语抽取方法
术语抽取从非结构化文本中自动抽取专业术语.该工作在中文分词、信息抽取、知识库构建中发挥着重要的作用.当前术语抽取方法很大程度上依赖于词的统计信息,由于基础教育学科中术语具有极强的长尾特性,导致基于统计的术语抽取方法很难抽取出处于尾端的术语.该文结合基础教育的学科特点,提出了DRT E:一种利用术语定义与术语关系挖掘,综合构词规则与边界检测的术语抽取方法.该文以初高中的数学课本为数据源进行术语抽取,实验结果表明我们的术语抽取方法F1值达到82.7%,相比目前的方法提高了40.8%,能够有效地在中文基础教育领域进行自动化的术语抽取.
术语抽取、术语定义、术语关系
32
TP391(计算技术、计算机技术)
国家科技部863课题2015AA015401
2018-06-05(万方平台首次上网日期,不代表论文的发表时间)
共9页
101-109