10.3969/j.issn.1002-1965.2010.08.031
WEB文本海量数据挖掘应用中的多点数据采集及处理问题研究
对海量数据采集与挖掘技术的问题,提出如何利用WEB文本进行多断点控制、并发采集、网上清洗等新技术方法进行海量数据采集及处理,构建了基于WEB文本海量数据挖掘的应用统计系统,实现了三千多万条原始数据的采集、转换、统计.
WEB挖掘、文本挖掘、海量数据、数据转换、网上清洗
29
TP274(自动化技术及设备)
广东省软科学基金项目"改革开放30年广东省科技投入产出科学计量学研究"2009B070300107的研究成果之一
2010-10-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
131-135