10.3969/j.issn.1001-7119.2013.10.056
引入宽度优先扩展概念的多样性数据分类过程
随着信息技术的迅猛发展,大型数据库中的数据正在呈几何级数增长,冗余分类技术已经成为信息组织的重要手段。在总结归纳已有的冗余分类算法弊端的基础上,参考决策树算法提出了一种新的基于数据库抽样的海量数据冗余分类算法。算法引入宽度优先扩展思路,并给出了算法的基本思想和具体实现过程,探讨了并行环境下进行计算的优化步骤。在与SPRINT算法的比较实验中,新算法展现了良好的性能和分类效率。
大型数据库、海量数据、冗余分类、分类方法、抽样
TP123(自动化基础理论)
广西教育厅科研项目201106LX864。
2013-11-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
168-170