10.3969/j.issn.1672-9722.2018.05.021
基于LSA的历史工作票问题分类异常检测
面向历史数据的问题分类异常检测是数据预处理过程中十分重要的环节,对后续工作中分类以及聚类的精度有着直接的影响,高质量的历史数据可显著提高分类及聚类效果.然而,工作票内容复杂、结构自由等特点使得传统的异常数据检测算法已不再适用.鉴于此,论文在基于距离的异常数据检测算法基础上,引入潜在语义分析(LSA)概念和信息熵(comentropy)概念,定义基于潜在语义分析和信息熵的异常度来度量工作票之间的异常程度,并提出基于潜在语义分析的工作票问题分类异常检测算法.理论分析及实验结果表明,改进的问题分类异常检测算法是有效可行的,且算法性能较优.
工作票、数据预处理、异常检测、潜在语义分析、信息熵
46
TP391(计算技术、计算机技术)
国家自然科学基金项目61000053
2018-06-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
950-955