基于黑盒水印的NLP神经网络版权保护
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11959/j.issn.2096−109x.2023009

基于黑盒水印的NLP神经网络版权保护

引用
随着自然语言处理(NLP,natural language processing)技术的快速发展,语言模型在文本分类和情感分析中的应用不断增加.然而,语言模型容易遭到盗版再分发,对模型所有者的知识产权造成严重威胁.因此,研究者着手设计保护机制来识别语言模型的版权信息.现有的适用于文本分类任务的语言模型水印无法与所有者身份相关联,且鲁棒性不足以及无法再生成触发集.为了解决这些问题,提出一种新的适用于文本分类任务模型的黑盒水印方案,可以远程快速验证模型所有权.将模型所有者的版权消息和密钥通过密钥相关的哈希运算消息认证码(HMAC,hash-based message authentication code)得到版权消息摘要,由HMAC得到的消息摘要可以防止被伪造,具有很强的安全性.从原始训练集各个类别中随机挑选一定的文本数据,将摘要与文本数据结合构建触发集,并在训练过程中对语言模型嵌入水印.为了评估水印的性能,在IMDB电影评论、CNEWS中文新闻文本分类数据集上对3种常见的语言模型嵌入水印.实验结果表明,在不影响原始模型测试精度的情况下,所提出的水印验证方案的准确率可以达到100%.即使在模型微调和剪枝等常见攻击下,也能表现出较强的鲁棒性,并且具有抗伪造攻击的能力.同时,水印的嵌入不会影响模型的收敛时间,具有较高的嵌入效率.

自然语言处理、文本分类、版权保护、语言模型、黑盒水印

9

TP391(计算技术、计算机技术)

海南省重点研发计划ZDYF2022GXTS224

2023-03-27(万方平台首次上网日期,不代表论文的发表时间)

共10页

140-149

相关文献
评论
暂无封面信息
查看本期封面目录

网络与信息安全学报

2096-109X

10-1366/TP

9

2023,9(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn