DOI：10.11999/JEIT220563

面向中文文本分类的字符级对抗样本生成方法

引用

摘要：

对抗样本生成是一种通过添加较小扰动信息,使得神经网络产生误判的技术,可用于检测文本分类模型的鲁棒性.目前,中文领域对抗样本生成方法主要有繁体字和同音字替换等,这些方法都存在对抗样本扰动幅度大,生成对抗样本质量不高的问题.针对这些问题,该文提出一种字符级对抗样本生成方法(PGAS),通过对多音字进行替换可以在较小扰动下生成高质量的对抗样本.首先,构建多音字字典,对多音字进行标注;然后对输入文本进行多音字替换;最后在黑盒模式下进行对抗样本攻击实验.实验在多种情感分类数据集上,针对多种最新的分类模型验证了该方法的有效性.

关键词：对抗样本生成、文本分类、情感分类、多音字、字符级对抗样本

所属期刊栏目：45

分类号：TP391.1;TN915.08(计算技术、计算机技术)

在线出版日期：2023-07-27（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：2226-2235

英文信息展示

期刊专题