10.16208/j.issn1000-7024.2021.09.014
不平衡数据集文本多分类深度学习算法
针对文本多分类算法中,由于不平衡数据集产生的小样本分类数据准确率低问题,提出基于轮廓系数动态K-means聚类的文本多分类混合式均分聚类采样算法.在不平衡数据集中针对小样本数据集利用聚类簇进行等比例过采样,针对大样本数据集利用聚类簇进行欠采样.基于微博灾害数据集,设计文本卷积神经网络,对该算法进行实验验证与分析,实验结果表明,该算法能够有效提升文本不平衡数据集的准确率和F1值,较好解决了不平衡文本数据集分类问题.
不平衡数据集、情感分类、文本多分类、聚类、深度学习
42
TP391(计算技术、计算机技术)
国家重点研发计划基金项目;河北省物联网监控工程技术研究中心基金项目
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
2501-2508