基于自然语言处理的文本泄密自动检测技术

引用

摘要：

因文本信息泄密导致的危害越来越严重,但传统的泄密检测还停留在人工查看,效率低且易造成二次泄密.针对以上问题,采用文本相似度自动比较和数据加密方法,提出了一种基于自然语言处理的文本泄密自动检测技术.在实际应用中,因检测粒度过粗可能导致漏检,采用基于自然段落和语句的相似度检测方法,方便疑似段落和语句的自动定位,最后设计并实现了一个文本泄密检测系统.实验结果表明,该技术能很好地应用于涉密文本泄密的检测,具有保密、人工干预少、效率高、疑似段落定位等特点.

关键词：自然语言处理、文本泄密:加密、相似度检测、信息抽取

所属期刊栏目：32

分类号：TP391(计算技术、计算机技术)

资助基金：中国博士后科学基金项目20080431114;南京信息工程大学校科研基金项目20070113

在线出版日期：2011-12-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：2600-2603

英文信息展示

期刊专题