10.3969/j.issn.1007-7375.2020.03.019
基于LOF算法的多维混合型数据控制图设计
为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF).在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性和名义型变量的信息熵,基于数据的密度来衡量观测点的异常程度.分别使用基于信用卡申请数据集的仿真案例和基于德国信用卡数据集的实例,对比MLOF控制图和现有混合型数据控制图在异常点检测上的表现.仿真案例共模拟了30种监测场景.结果表明,在57%的场景中,MLOF控制图的综合表现都是最好的.而实例也验证了MLOF控制图更适用于数据量大、聚类情况复杂的混合型数据监测过程中.
多维混合型数据、信息熵、距离量度、LOF算法、MLOF控制图
23
TP277(自动化技术及设备)
国家自然科学基金重点资助项目;国家自然科学基金资助项目
2020-07-14(万方平台首次上网日期,不代表论文的发表时间)
共9页
145-153