10.3969/j.issn.1000-3428.2014.08.034
基于选择度的分类规则学习算法
规则式分类器通常使用单一度量选择属性值,然而单一度量会导致很多属性值具有相同的度量值,从而无法选择出“好”的属性值.此外,规则式分类器通常提取置信度为100%的规则,致使规则提取过程比较费时,并且所得到的规则支持度较低.针对上述不足,提出新的属性值度量——选择度.选择度是基于信息熵、类支持度及偏离度3种度量的结合,能更好地区分属性值的优劣.在此基础上,提出一种基于选择度的分类规则学习算法LRSM.在LRSM算法中,当规则包含的负实例数小于给定域值时,该规则被抽取,删除被此规则覆盖的实例,抽取下一条规则.实验结果表明,与FOIL算法相比较,LRSM算法提高了分类准确率,同时明显地减少了分类所消耗的时间.
数据挖掘、分类、FOIL算法、LRSM算法、偏离、选择度
40
TP18(自动化基础理论)
国家自然科学基金资助项目61170129;福建省自然科学基金资助项目2013J01259;漳州师范学院基金资助项目SK08001
2014-09-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
179-182,189