10.16652/j.issn.1004-373x.2016.07.028
基于粗糙集的海量数据挖掘算法研究
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法。讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明,改进算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。
数据挖掘、粗糙集、大数据处理、并行计算
39
TN911-34;TQ028.1
2016-05-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
115-119