一种信息处理方法、装置、电子设备及存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种信息处理方法、装置、电子设备及存储介质

引用
本申请提供了一种信息处理方法、装置、电子设备及存储介质,该方法包括:获取目标账户的历史对话数据以及当前问询语句;基于历史对话数据确定目标账户的账户特征信息,并基于当前问询语句,生成多个回复信息;账户特征信息至少包括如下特征信息中的一种:角色信息、意图信息和情感信息;从多个回复信息中,确定与账户特征信息相匹配的目标回复信息,作为针对当前问询语句的回复信息。由于最终的目标回复信息是与用户的账户特征信息相匹配的回复信息,因此,为用户提供的回复信息的准确率较高。

发明专利

CN202211049737.3

2022-08-30

CN117672208A

2024-03-08

G10L15/22(2006.01)

北京及云智能科技有限公司

刘桐;王俊

100192 北京市海淀区清河西三旗东新都东站南26幢平房021

北京润泽恒知识产权代理有限公司

李燕春

北京;11

1.一种信息处理方法,其特征在于,包括: 获取目标账户的历史对话数据以及当前问询语句; 基于所述历史对话数据确定所述目标账户的账户特征信息,并基于所述当前问询语句,生成多个回复信息;所述账户特征信息至少包括如下特征信息中的一种:角色信息、意图信息和情感信息; 从所述多个回复信息中,确定与所述账户特征信息相匹配的目标回复信息,作为针对所述当前问询语句的回复信息。 2.根据权利要求1所述的方法,其特征在于,在基于所述历史对话数据确定所述目标账户的账户特征信息,并基于所述当前问询语句,生成多个针对所述当前问询语句的回复信息之前,还包括: 确定所述历史对话数据所包括的第一关键词,以及,所述当前问询语句所包括的第二关键词; 对所述第一关键词进行编码,得到所述第一关键词对应的第一词向量,并对所述第二关键词进行编码,得到所述第二关键词对应的第二词向量。 3.根据权利要求2所述的方法,其特征在于,所述基于所述历史对话数据提取所述目标账户的账户特征信息,并基于所述当前问询语句,生成多个回复信息,包括: 提取所述第一词向量的语义特征,得到第一语义特征向量,并提取所述第二词向量的语义特征,得到第二语义特征向量; 通过所述第一语义特征向量,确定所述目标账户的账户特征信息; 通过所述第二语义特征向量,生成多个回复信息。 4.根据权利要求1所述的方法,其特征在于,所述从所述多个回复信息中,确定与所述账户特征信息匹配的目标回复信息,作为针对所述当前问询语句的回复信息,包括: 提取所述账户特征信息的语义特征,得到账户特征信息对应的第三语义特征向量,并分别提取所述多个回复信息的语义特征,得到所述多个回复信息分别对应的第四语义特征向量; 对于每一回复信息对应的第四语义特征向量,将所述第三语义特征向量与该回复信息对应的第四语义特征向量进行匹配,得到该回复信息对应的第四语义特征向量与所述第三语义特征向量之间的匹配度; 将所述多个回复信息中,匹配度大于预设匹配度的第四语义特征向量所对应的回复信息,确定为目标回复信息,作为针对所述当前问询语句的回复信息。 5.根据权利要求1至4任一项所述的方法,其特征在于,所述获取目标账户的历史对话数据,包括: 获取多轮历史对话数据;每轮历史对话数据对应的一个轮次信息;每轮历史对话数据对应的轮次信息用于表征该轮历史对话数据与所述当前问询语句之间的时间间隔; 相应的,所述基于所述历史对话数据确定所述目标账户的账户特征信息,包括: 在所述多轮历史对话数据中,基于所述多轮历史对话数据分别对应的轮次信息,确定与所述当前问询语句之间的时间间隔小于预设时间间隔的目标历史对话数据; 基于所述目标历史对话数据提取所述目标账户的账户特征信息。 6.根据权利要求2所述的方法,其特征在于,所述对所述第一关键词进行编码,得到所述第一关键词对应的第一词向量,包括: 确定所述当前问询语句包括的多个第一关键词,以及,每个第一关键词在所述当前问询语句中的位置信息; 基于所述多个关键词在所述当前问询语句的位置信息,确定所述多个关键词在所述当前问询语句的先后顺序; 按照所述多个关键词在所述当前问询语句的先后顺序,依次对所述第一关键词进行编码,得到所述当前问询语句包括的第一关键词对应的第一词向量。 7.一种信息处理装置,其特征在于,包括: 数据获取模块,用于获取目标账户的历史对话数据以及当前问询语句; 信息生成模块,用于基于所述历史对话数据确定所述目标账户的账户特征信息,并基于所述当前问询语句,生成多个回复信息;所述账户特征信息至少包括如下特征信息中的一种:角色信息、意图信息和情感信息; 信息处理模块,用于从所述多个回复信息中,确定与所述账户特征信息相匹配的目标回复信息,作为针对所述当前问询语句的回复信息。 8.根据权利要求7所述的装置,其特征在于,还包括: 关键词确定模块,用于在基于所述历史对话数据确定所述目标账户的账户特征信息,并基于所述当前问询语句,生成多个针对所述当前问询语句的回复信息之前,确定所述历史对话数据所包括的第一关键词,以及,所述当前问询语句所包括的第二关键词; 关键词编码模块,用于对所述第一关键词进行编码,得到所述第一关键词对应的第一词向量,并对所述第二关键词进行编码,得到所述第二关键词对应的第二词向量。 9.根据权利要求8所述的装置,其特征在于,所述信息生成模块,具体用于: 提取所述第一词向量的语义特征,得到第一语义特征向量,并提取所述第二词向量的语义特征,得到第二语义特征向量; 通过所述第一语义特征向量,确定所述目标账户的账户特征信息; 通过所述第二语义特征向量,生成多个回复信息。 10.根据权利要求7所述的装置,其特征在于,所述信息处理模块,具体用于: 提取所述账户特征信息的语义特征,得到账户特征信息对应的第三语义特征向量,并分别提取所述多个回复信息的语义特征,得到所述多个回复信息分别对应的第四语义特征向量; 对于每一回复信息对应的第四语义特征向量,将所述第三语义特征向量与该回复信息对应的第四语义特征向量进行匹配,得到该回复信息对应的第四语义特征向量与所述第三语义特征向量之间的匹配度; 将所述多个回复信息中,匹配度大于预设匹配度的第四语义特征向量所对应的回复信息,确定为目标回复信息,作为针对所述当前问询语句的回复信息。 11.根据权利要求7至10任一项所述的装置,其特征在于,所述数据获取模块,具体用于: 获取多轮历史对话数据;每轮历史对话数据对应的一个轮次信息;每轮历史对话数据对应的轮次信息用于表征该轮历史对话数据与所述当前问询语句之间的时间间隔; 相应的,所述信息生成模块,具体用于: 在所述多轮历史对话数据中,基于所述多轮历史对话数据分别对应的轮次信息,确定与所述当前问询语句之间的时间间隔小于预设时间间隔的目标历史对话数据; 基于所述目标历史对话数据提取所述目标账户的账户特征信息。 12.根据权利要求8所述的装置,其特征在于,所述关键词编码模块,具体用于: 确定所述当前问询语句包括的多个第一关键词,以及,每个第一关键词在所述当前问询语句中的位置信息; 基于所述多个关键词在所述当前问询语句的位置信息,确定所述多个关键词在所述当前问询语句的先后顺序; 按照所述多个关键词在所述当前问询语句的先后顺序,依次对所述第一关键词进行编码,得到所述当前问询语句包括的第一关键词对应的第一词向量。 13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一项所述的数据处理方法的步骤。 14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的数据处理方法的步骤。
相关文献
评论
法律状态详情>>
相关作者
相关机构