DOI：10.19363/J.cnki.cn10-1380/tn.2020.09.07

复述检测技术综述

引用

摘要：

网络内容安全日益受到各界的关注.自然语言处理中用于判断两个文本语义是否相同的复述检测技术,可以把语义相同表述形式不同的的看法、意见等聚成一类,大幅提高舆情监控的效率;亦可识别出经过改写的不良敏感信息,有效提高不良敏感信息的召回率.本文旨在介绍当前复述检测技术领域的研究进展.首先介绍复述检测的概念、应用场景和研究现状.然后对复述检测方法进行分类,本文从计算方式上将复述检测方法分为基于相似度的方法和基于特征的方法,依次介绍每类方法的特点、优缺点,并详述一些有代表性的方法,重点介绍了基于深度学习的复述检测方法.最后详细分析了复述检测技术当前存在的问题,并对未来的发展趋势进行了展望.

关键词：网络内容安全、网络舆情监控、自然语言处理、复述检测、深度学习、神经网络

所属期刊栏目：5

分类号：TP391.1(计算技术、计算机技术)

资助基金：本课题得到国家重点研发计划课题;中国科学院战略性先导科技专项C类

在线出版日期：2020-11-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共15页

页码：95-109

英文信息展示

期刊专题