WKAG:一种针对不平衡医保数据的欺诈检测方法

引用

摘要：

医保欺诈检测具有迫切的现实意义,当前工作主要以机器学习方法为主,但面临两个重要问题:(1)数据不平衡问题较为突出,欺诈样本占比极小,影响识别效果;(2)数据特征的选取与构造过于依赖领域业务知识,难以保证特征有效性.针对这些问题,提出了一种针对不平衡医保数据的欺诈检测方法——WKAG.使用WGAN-KDE(Wasserstein Generative Adversarial Network-Kernel Density Estimation)方法改善数据不平衡问题,结合自编码器(Auto-Encoder)提取数据的深层隐藏特征,使用Gradient Boosted Decision Tree(GBDT)检测医保欺诈行为.在多个公开数据集上验证了该方法有效性,并在真实医保业务数据集上进行了实验验证,结果表明了WKAG可作为医保欺诈行为的有效检测方法.

关键词：生成对抗网络、不平衡类、自编码特征表示、医保欺诈检测、集成学习

所属期刊栏目：57

分类号：TP391(计算技术、计算机技术)

资助基金：中国科学院STS计划;中科院创新青年促进会;自治区天山青年计划

在线出版日期：2021-05-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：247-254

英文信息展示

期刊专题