10.3969/j.issn.1000-3428.2007.01.024
数据清理中同体不同源数据的数化算法研究
在数据仓库构建的数据清理过程中,同体不同源数据的发现一直是清理过程的难点.在现实情况下,存在的单一实体在不同的数据源中以不同的方式进行存储或者表达的同体不同源数据,传统数据清理技术对其发现、修正需要花费大量的时间和系统资源进行比较,实际效果并不理想.该文提出一种新型的、利用数据数字化存储特点来查找同体不同源数据的算法,能够有效减少数据间的比较次数,并确保数据清理结果的质量.
同体不同源数据、数化、数据清理
33
TP311.13(计算技术、计算机技术)
上海市高等学校青年科学基金01QN59;上海市高等学校科学技术发展基金04AB29
2007-03-05(万方平台首次上网日期,不代表论文的发表时间)
共3页
71-73