10.3969/j.issn.1001-8972.2005.24.009
一种基于信息熵的可伸缩决策树算法
提出了一种基于信息熵的可伸缩决策树生成算法SDTA(A Scalable Decision Tree Algorithm).与SPRINT算法不同,该算法使用基于信息熵增益的思想分割训练样本集,引入了新的数据结构:基于类别的属性表.该表记录存储了计算分割属性的所有信息,并且该表的大小不会随样本集的增大而增大,可以常贮主存.与SLIQ算法相比,SDTA算法彻底摆脱了主存容量对算法效率的限制.实验表明,SDTA算法能生成正确的决策树,而且具有良好的可伸缩性.
分类、决策树、可伸缩
O4(物理学)
2006-01-12(万方平台首次上网日期,不代表论文的发表时间)
共1页
15