10.3969/j.issn.1003-0077.2011.03.005
采用改进重采样和BRF方法的定义抽取研究
为了从专业领域语料中发现并获取所有的专业术语定义,该文提出了使用分类方法进行专业术语定义抽取的方法.该文采用一种基于实例距离分布信息的过采样方法,将其与随机欠采样方法结合用以建立平衡训练语料,并使用BRF(Balanced Random Forest)方法来获得C4.5决策树的聚合分类结果.该方法获得了最好65%的F1-measure成绩和78%的F2-measure成绩,超过了仅使用BRF方法取得的成绩.
自然语言处理、术语定义、定义抽取、文本分类、重采样
25
TP391(计算技术、计算机技术)
民航总局专项科技基金项目E9905
2011-08-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
30-37