10.3969/j.issn.1672-6987.2013.04.020
基于信息熵的粗糙集连续属性多变量离散化算法
属性离散化能够降低问题的复杂度,得到更加简短、精确且易于理解的规则.针对现有离散化方法在选择断点时没有考虑属性间和属性内断点的互斥性且不能保证保持决策表的不可分辨关系,本研究提出一种新的基于信息熵的粗糙集连续属性多变量离散化算法(PAD).它以信息熵作为选择断点的衡量标准,以不可分辨关系为停止标准并引入5条断点预选确选策略.实验结果表明,引入断点预选、确选策略的PAD算法与Rostta软件中的5个离散化算法相比,具有较高的预测精度和较少的断点数目.
粗糙集、不可分辨关系、离散化、信息熵
34
P208(一般性问题)
国家自然科学基金项目61273180
2013-11-12(万方平台首次上网日期,不代表论文的发表时间)
共4页
423-426