10.14188/j.1671-8836.2016.02.004
基于PLSA的即时通信取证方法
面对大量繁杂的即时通信数据,司法取证人员很难快速从中找到与案件相关的数据.本文提出一种基于PLSA(probability latent semantic analysis)算法的即时通信取证方法,即利用PLSA算法进行主题挖掘,快速获取与案件相关的可疑数据.通过建立自定义词库和动态调整词库中词项的矢量权重,提高PLSA算法主题挖掘的准确性,对聊天会话中主题的矢量值进行可视化.实验结果表明,该方法的准确率,召回率及F1值比单纯用PLSA算法都有提高.
即时通信、取证、主题挖掘、PLSA算法、矢量权重
62
TP311.1(计算技术、计算机技术)
国家自然科学基金;郑州市科技攻关计划
2016-04-28(万方平台首次上网日期,不代表论文的发表时间)
122-126