基于同步频繁树的时间序列关联规则分析
针对经典算法Apriori和频繁模式增长算法(frequent pattern growth,FP-growth)不能直接对时间序列数据进行关联规则挖掘的问题,提出一种同步频繁树算法(synchronize frequent tree,SFT).利用时间序列的时间属性具有一维性的特点,定义趋势项-位置表示法表示时间序列数据,将首条时间序列构建成一棵基础树,通过计算树叶子节点与列表项的信息交集,可判断其是否与该树枝中的所有节点构成频繁K项集.在SFT算法中,用趋势项-位置表示的数据内存占用情况要优于原始数据,并且在挖掘过程中不会产生候选频繁项集,使得算法在整个挖掘过程中表现出较好的时间性能.基于商品数据和股票数据的数值实验表明,SFT算法所得结果不仅与其他5种对比算法的结果一致,在各量级的数据和不同的支持度计数中,其时间复杂度都要优于对比算法.
时间序列;线性分段;趋势项-位置;事务集表示;频繁项集;同步频繁树;关联规则;时间效率
16
TP311.13(计算技术、计算机技术)
国家自然科学基金项目;福建省自然科学基金项目;福建省社会科学规划一般项目
2021-08-31(万方平台首次上网日期,不代表论文的发表时间)
共9页
502-510