10.3969/j.issn.1673-629X.2007.07.024
可扩展和可交互的数据清洗系统
可扩展性和可交互性是数据清洗系统的主要特征.为了说明此系统的特点,列举产生异常数据的原因,用系统框架图来解释各个功能模块,提出用统计学等方法检测异常数据,针对不同类型的异常数据提出相应的清洗策略,并说明如何评估算法的优良性和数据准确性,最后用流程图来说明整个系统.人口数据清洗结果显示人口数据质量大幅度提高了,同时也证明此系统有很高的执行效率.
数据仓库、数据检测、数据清洗
17
TP311(计算技术、计算机技术)
2007-08-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
84-86,90