10.16208/j.issn1000-7024.2022.02.016
基于分层欠采样和Bi-GRU的恶意行为检测模型
为解决类不平衡和样本重叠问题,提出一种基于分层欠采样和Bi-GRU的恶意行为检测模型(SSU-BG).数据预处理及特征模型的构建;基于欧氏距离算法统计出高频样本的最高密度点及类内平均距离,根据样本分布特点将高频类样本依次划分为稀疏区、稀疏区边界区及稠密区3个区域,根据抽取出样本标签数在稠密区内划分出不同层次圆环,计算每个类的不均衡度,计算其均值作为整个样本的采样比例,按照此时的采样比例在稀疏区边界区的圆环域和稠密区进行分层随机欠采样;将文本向量输入训练好的Bi-GRU模型中.实验结果表明,该模型改善了整体检测效果,提高了恶意评论检测率.
恶意评论;类不平衡;分层欠采样;Bi-GRU网络;SSU-BG算法
43
TP391(计算技术、计算机技术)
国家自然科学基金;广西科技厅科技开发重点基金项目;NSFC-广东联合基金重点基金项目
2022-03-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
413-419