基于自然语言处理的文本泄密自动检测技术
因文本信息泄密导致的危害越来越严重,但传统的泄密检测还停留在人工查看,效率低且易造成二次泄密.针对以上问题,采用文本相似度自动比较和数据加密方法,提出了一种基于自然语言处理的文本泄密自动检测技术.在实际应用中,因检测粒度过粗可能导致漏检,采用基于自然段落和语句的相似度检测方法,方便疑似段落和语句的自动定位,最后设计并实现了一个文本泄密检测系统.实验结果表明,该技术能很好地应用于涉密文本泄密的检测,具有保密、人工干预少、效率高、疑似段落定位等特点.
自然语言处理、文本泄密:加密、相似度检测、信息抽取
32
TP391(计算技术、计算机技术)
中国博士后科学基金项目20080431114;南京信息工程大学校科研基金项目20070113
2011-12-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
2600-2603