10.19678/j.issn.1000-3428.0058601
面向对比序列模式发现的独立精确置换检验算法
传统的对比序列模式挖掘算法存在一定数量的假阳性对比序列模式,其提供的错误信息会干扰后续任务的决策.设计一种IEP-DSP算法过滤假阳性对比序列模式.运用spade方法和WRAcc对比性度量找到候选对比序列模式和所有置换数据集合中的对比序列模式,通过模拟置换过程,使用独立精确置换检验方法为不同长度的模式建立独立精确零分布,并计算每个候选对比序列模式的精确p-value,运用错误发现率度量将各个长度的假阳性对比序列模式数量控制在置信度为α的统计显著水平下.在真实数据集和仿真数据集上的实验结果表明,IEP-DSP算法够过滤掉大量的假阳性对比序列模式,相比基于统计显著性检验的方法能保留更多的真对比序列模式,验证了独立精确置换检验相较于标准置换检验的优越性.
数据挖掘;模式发现;对比序列模式挖掘;统计显著性检验;独立精确置换检验
47
TP391(计算技术、计算机技术)
国家自然科学基金;贵州省教育厅青年科技人才成长项目;贵州省科技厅联合基金;贵州省教育厅工程研究中心项目
2021-08-23(万方平台首次上网日期,不代表论文的发表时间)
共10页
45-53,61