10.3969/j.issn.1001-3695.2010.02.040
ETL工作流活动优先级的确定及并行实现
ETL流程是一个以数据为中心的工作流,对ETL工作流的执行过程进行论述,提出了一个算法,计算ETL工作流中各个活动的执行优先级,在工作流执行中为优先级相同且相互之间没有依赖关系的活动集创建多个线程,通过并行执行这些活动,提高了ETL工作流的执行效率.实验结果表明,所提出的并行算法与串行算法比较,在数据量足够大的情况下,加速比可接近理想值,加速比随着数据量增大而提高.
数据仓库、抽取、转换和加载工作流、执行优先级、并行执行
27
TP311(计算技术、计算机技术)
数据仓库关键技术研究及其实现2006Z3-D3081;国际仓储物流信息交换服务平台技术研究0711420500008;广东省基础软件与应用构建技术实验室2006B80407001
2010-04-06(万方平台首次上网日期,不代表论文的发表时间)
共4页
548-551