10.19678/j.issn.1000-3428.0064374
基于舆情新闻的中文关键词抽取综述
基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容.随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代.梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势.此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决.为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致.在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望.
舆情监测、关键词抽取、核心词汇、深度学习、自然语言处理
49
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家重点研发计划;新疆维吾尔自治区重点科技专项;四川省区域创新合作项目;新疆维吾尔自治区自然科学基金
2023-03-17(万方平台首次上网日期,不代表论文的发表时间)
共17页
1-17