10.16337/j.1004-9037.2017.05.010
基于重采样和集成选择的适用于实体识别的多分类器系统
实体识别常利用分类器根据记录对的字段相似度向量将记录对分为匹配、不匹配和可能匹配,因此分类器的准确性与实体识别的准确性直接相关.为提高分类准确性,本文基于重采样和集成选择技术构建一个多分类器系统.充分利用实体识别的特点,在分类之前发现分类困难的样本,并使重采样比率在一个区间内变化,生成一组重采样样本;然后用重采样后的样本训练分类器构建一个并行多分类器系统,强调分类器之间的差异度和稀疏度,从该多分类器系统中选择最优分类器子集,即最优的重采样比率组合,分别用非线性规划和极值方法求解该集成选择模型.实验结果表明,本方法与现有的多分类器系统相比具有更高的准确性.
实体识别、多分类器系统、重采样、集成选择、差异度
32
TP311(计算技术、计算机技术)
国家自然科学基金61371196;中国博士后科学基金201003797特别资助项目;解放军理工大学预研基金20110604,41150301
2018-03-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
931-938