10.3969/j.issn.1000-3428.2008.17.015
连续属性离散化的Imp-Chi2算法
连续属性离散化足机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性.经过研究Chi2系列算法,提出一种新的基于属性最要性的连续属性离散化方法-Imp-Chi2算法,该算法依据属性重要性程度对属性离散化的顺序进行了合理的调整,能够更准确地对连续属性进行离散化.文章通过C4.5和支持向量机分别对离散化后的结果进行了实验,在实验过程中,提出一种训练集类比例抽取片法,避免了训练集随机抽取的不均匀性.实验结果证明了所提算法的有效性.
连续属性离散化、Chi2算法、属性重要性、训练集类比例抽取
34
TP18(自动化基础理论)
国家自然科学基金资助项目60372071;辽宁省教育厅高等学校科学研究基金资助项目2004C031;辽宁师范大学校基金
2008-12-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
39-41