基于改进的CHI统计方法在文本分类中的应用
随着文本分类技术的发展与成熟,越来越多的企业将其应用到客户投诉分类系统中,并获得了一定的效果.针对传统卡方统计方法偏向于选择出负相关低频噪音词,将改进的CHI统计方法运用到文本特征选择,通过降低负相关低频词在特征选择算法中的权重,减小其对模型的影响.最后,对某省通信公司的业务投诉文本进行实验,结果表明该模型和方法是有效的,能更准确地对业务投诉工单进行分类,从而为后续问题的分析提供数据支持.
业务投诉、文本分类、特征选择、卡方统计方法
25
P64;TP3
2016-12-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
136-140