10.3969/j.issn.1000-7024.2002.02.020
基于信息论的连续属性离散化
使用信息论的方法进行连续属性的离散化.引入Hellinger偏差HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均.分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限.
归并离散、划分离散、切分点、HD偏差、区间距离
23
TP18(自动化基础理论)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
62-64