10.3969/j.issn.1006-9348.2022.05.085
基于文本挖掘的多用户投诉数据流聚类算法
传统数据聚类算法缺乏对文本信息的挖掘,造成聚类效果较差,因此提出一种基于文本挖掘的多用户投诉数据流聚类算法.依据文本挖掘技术原理,选择支持向量机作为文本聚类模型,在算法设计中,首先提取多用户投诉数据文本特征,根据关键字权值和特征项总数,将高维度向量空间降维,删除无关紧要的特征项.使用综合度量法,计算Euclid距离、赫尔曼距离以及正弦相似度得到文本之间相似性,最后优化数据流聚类算法聚类流程,完成聚类算法的设计.设计实验测试所提聚类算法和传统算法的聚类性能,结果表明所提聚类算法的F1值较高,聚类性能优于传统算法.
文本挖掘、数据流、聚类算法、支持向量机、关键字权值
39
TP391.9(计算技术、计算机技术)
吉林省科技发展计划项目;吉林省科技发展计划项目;吉林省教育厅科学研究项目
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
423-426,498