10.19678/j.issn.1000-3428.0057081
融合马尔科夫决策过程与信息熵的对话策略
对话策略是人机对话系统中的重要组成成分,其性能的优劣直接影响对话系统的性能.在面对完全没有数据的冷启动场景时,收集对话数据进行对话策略学习的过程非常复杂和耗时.为在冷启动场景下能够保持良好性能,提出一种融合马尔科夫决策过程与信息熵的对话算法.利用马尔科夫决策过程快速获得下一步最优对话状态,并结合知识库通过引入属性信息熵方法排除多个状态值函数相同的最优状态,从而获取最优的系统响应动作.在音乐搜索领域数据集上的实验结果表明,与随机策略、基于规则和基于信息熵的算法相比,该算法分别缩短了2.24、0.84和0.03个对话轮次,且能够有效提高对话任务完成率.
对话系统、对话策略、冷启动、信息熵、马尔科夫决策过程
47
TP391(计算技术、计算机技术)
广东省自然科学基金"面向在线社会网络的信息传播结构分析与宏观预测";广东省应用型科技研发专项资金重点项目"面向移动互联网用户大数据分析及推荐平台的产业化应用";广州市科技项目"基于大数据分析的移动音乐智能搜索与推荐平台"
2021-03-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
284-290