10.16652/j.issn.1004-373x.2016.17.029
基于粗糙集的海量数据挖掘算法研究
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法;讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明改进的算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。
数据挖掘、粗糙集、大数据处理、并行计算
39
TN911-34;TQ028.1
2015年四川省教育厅项目基于主题爬虫技术的网络舆情监督及热点发现研究15ZB0258;2015年四川省教育厅旅游研究中心项目数据挖掘算法在智慧服务中的应用LYC15-16
2016-10-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
116-119,123