10.3969/j.issn.1002-137X.2001.02.030
基于多值属性和数值属性数据的遗传分类算法
@@ 1 引言
传统的遗传分类算法[1]只能够从字符属性(枚举类型,取值有限)中发现分类规则.当属性取值很多时,所得到的规则数目也急剧增加,数据的规律性不能够很好地被认识到.虽然有许多算法可以合并规则,减少规则的数目,但是这种合并是在规则已经得到的情况下进行的,后面的实验可以表明,若合并在搜索过程进行,遗传算法的效率可以得到有效的提高.传统遗传分类算法的另外一个不足是它不能够处理数值属性(连续取值,取值无限).而现实的问题是数据开采面对的数据一般既包含字符属性又包含数值属性(这种数据在本文称之为混合数据),这时传统的遗传分类算法往往无能为力.这些数值属性,如医疗数据中的年龄(AGE)字段,即使在待开采数据集中它的取值是有限的,我们也不能把它与字符属性等同看待,因为它表示含义是连续的.
多值属性、数值属性、属性数据、遗传算法、分类算法、取值、合并规则、字符、医疗数据、搜索过程、数据开采、混合数据、规则数目、分类规则、数据集、规律性、被认识、字段、效率、实验
28
TP18(自动化基础理论)
国家自然科学基金97670019
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
119-121