统计学历史上的经典数据挖掘案例
学界关于数据挖掘(Data Mining)的起源可谓莫衷一是,直到1995年,知识发现国际会议(Knowledge Discovery in Database)才首次进行明确定义:数据挖掘是在众多数据中找出有用且属于未知数据的过程.此后数年内,国际专业统计软件SAS软件研究所、美国得克萨斯大学达拉斯分校(The University of Texas at Dallas)的工程学和计算机专家Bhavani Thuraisingham、伦敦帝国大学统计学教授David Hand和美国伊利诺伊大学IEEE和ACM院士、数据挖掘领域的首位华人专家韩家炜教授等陆续阐释了数据挖掘的概念、原理、技术和方法,概而言之,数据挖掘就是综合利用模式识别技术、各种统计分析方法和数学工具,对存储在数据仓库和信息库中大量的、模糊的、不完全的、有噪声的、随机的实际应用数据进行有效挖掘,试图寻找并抽取有意义的、隐含的、或者是以前未知但有潜在价值的信息的非平凡过程.
2014-11-18(万方平台首次上网日期,不代表论文的发表时间)
22-23