水文时间序列模体挖掘
水文时间序列数据中蕴藏着自然演变的规律和人类活动对下垫面影响的信息。通过序列模式挖掘技术发现这些时空序列中蕴藏的洪水频率、水文情势突变等物理规律能够为水文预测预报、防汛调度等提供辅助决策支持。模体是指在一组序列中重复出现的相似片段模式。时间序列模体数据挖掘就是利用数据挖掘思想,在时间序列中找出重复出现的相似片段的过程。本文针对水文时间序列的特点以及对洪水和旱情的挖掘需求,提出基于小波变换、极值点分解和符号化的模体挖掘方法GSB—VLMD(Grammars & Semantics Based—Variable Length Motifs Discovery)。其中小波变换负责对数据去噪,使处理后的数据变得更加平滑;极值点分解负责从平滑数据中提取洪水和干旱等极值语义信息;符号化负责离散化数据,为模体挖掘Sequitur算法提供输入。以太湖近50年水位序列作为源数据,使用该方法对其进行模体挖掘,结果证明了其正确性和实用性。
模体、数据挖掘、水文时间序列、Sequitur、小波变换
43
P333.6(水文科学(水界物理学))
国家自然科学基金项目51079040;水利部948项目201016;江苏省科技支撑计划BE2012179;感谢水利部太湖流域管理局和无锡水文水资源监测局提供本文实验数据
2013-03-16(万方平台首次上网日期,不代表论文的发表时间)
共9页
1422-1430