一种基于Word2vec的敏感内容识别技术
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1002-0802.2019.11.029

一种基于Word2vec的敏感内容识别技术

引用
随着数据量的爆炸式增长,企业面临数据安全防护的难题,尤其是文本数据的安全防护.传统的精确匹配识别文本中敏感词的方法,因存在相似词而导致遗漏,造成数据泄露.于是,提出了一种基于Word2vec结合人工设定的不同等级敏感词识别技术,从语义层面识别文本中的敏感词,并根据提出的敏感度模型计算文本敏感度,判断文本敏感等级.实验结果表明,与传统方法相比,提出的技术方法能够更准确、全面地识别文本敏感内容,并确定文本敏感等级.

敏感词、TextRank算法、Word2vec、文本敏感等级

52

TP309(计算技术、计算机技术)

“核高基”国家科技重大专项No.2017ZX01030-201

2020-05-11(万方平台首次上网日期,不代表论文的发表时间)

共7页

2750-2756

相关文献
评论
暂无封面信息
查看本期封面目录

通信技术

1002-0802

51-1167/TN

52

2019,52(11)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn