10.3969/j.issn.1671-7597.2012.20.041
利用Apache Hadoop进行TB级排序
数据正以惊人的速度激增。从出现文明到2003年,人类总共才创造5EB的数据,但是我们现在仅在两天内就创造出相同的数据量!到2012年,全球数字数据量将增长至2.72ZB,并以每两年翻番的速度增长,到2015年将达到8ZB。因此大数据的分析和处理现在成为各领域的热点研究方向。而大数据的排序,是大数据分析中的第一步工作。
Apache、Hadoop、大数据、分布式计算
TP311(计算技术、计算机技术)
2013-01-27(万方平台首次上网日期,不代表论文的发表时间)
共2页
25-26