10.19678/j.issn.1000-3428.0055414
基于特征矩阵构造与BP神经网络的垃圾文本过滤模型
在网络社交平台海量的信息文本中含有许多垃圾文本,这些文本的广泛散布影响了人们正常社交.为此,提出一种垃圾文本过滤模型.通过BERT模型提取文本的句编码,采用B-Feature方法对句编码进行特征构造,并根据文本与所得特征之间的联系进一步将该特征构造为特征矩阵,运用BP神经网络分类器对特征矩阵进行处理,检测出垃圾文本并进行过滤.实验结果表明,该模型在长、中、短文本数据集上的准确率较TFIDF-BP模型分别提高7.8%、3.8%和11.7%,在中、短文本数据集上的准确率较朴素贝叶斯模型分别提高2.1%和13.7%,能有效对垃圾文本进行分类和过滤.
BERT模型、特征构造、BP神经网络、垃圾文本过滤、文本分类、句编码
46
TP391.1(计算技术、计算机技术)
国家自然科学基金;河南省科技发展计划项目
2020-09-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
271-276