利用收益预测与策略梯度两阶段众包评论集成

引用

摘要：

近年来随着互联网的飞速发展,人们频繁地在网络上发布关于某一特定对象的评论内容,快速掌握众包评论文本的关键信息对决策制定、服务调整有着重要作用,对众包评论文本集成进行深入研究亦显得十分必要.众包评论文本集成旨在将不同评论者对同一对象的评论内容以既定压缩率整合成较短的集成文本,从而根据大众认知形成关于特定对象较为匹配的内容描述.针对该问题提出了一种利用收益预测与策略梯度的两阶段众包评论集成方法.该方法不依赖于任何人工真值,仅提供源众包评论文档,由代理根据收益经验自行抽取关键语句形成众包评论集成文档.具体而言,第一阶段以语句相关性与冗余性衡量集成文档内容质量,以此作为收益,利用Q-值学习预测出从当前语句选择起直至评论集成结束时所产生的长期收益,由此指导代理学习最优语句选择策略;在此基础上,第二阶段以集成文档情感强度为收益,利用策略梯度(上升)进一步调整第一阶段代理习得的语句选择策略,使得代理所产生集成文本在具备一定内容质量同时,从客观角度突显文本情感强度,更明确反映出评论者所持有的情感态度.实验结果表明,与现有相关方法相比,所提出方法在评论文本集成内容质量与情感强度方面总体取得最优,且产生集成文档所耗费时长仍控制在可接受范围之内.

关键词：众包数据集成;真值推测;深度学习;人工智能

所属期刊栏目：15

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金;南京信息工程大学人才启动经费

在线出版日期：2021-08-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共14页

页码：1476-1489

英文信息展示

期刊专题