DOI：10.3969/j.issn.1000-3428.2014.08.034

基于选择度的分类规则学习算法

引用

摘要：

规则式分类器通常使用单一度量选择属性值,然而单一度量会导致很多属性值具有相同的度量值,从而无法选择出“好”的属性值.此外,规则式分类器通常提取置信度为100％的规则,致使规则提取过程比较费时,并且所得到的规则支持度较低.针对上述不足,提出新的属性值度量——选择度.选择度是基于信息熵、类支持度及偏离度3种度量的结合,能更好地区分属性值的优劣.在此基础上,提出一种基于选择度的分类规则学习算法LRSM.在LRSM算法中,当规则包含的负实例数小于给定域值时,该规则被抽取,删除被此规则覆盖的实例,抽取下一条规则.实验结果表明,与FOIL算法相比较,LRSM算法提高了分类准确率,同时明显地减少了分类所消耗的时间.

关键词：数据挖掘、分类、FOIL算法、LRSM算法、偏离、选择度

所属期刊栏目：40

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金资助项目61170129;福建省自然科学基金资助项目2013J01259;漳州师范学院基金资助项目SK08001

在线出版日期：2014-09-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：179-182,189

英文信息展示

期刊专题