10.3969/j.issn.1006-9348.2021.09.071
知识数据库中非结构化文本关键信息抽取模型
针对传统文本关键信息抽取模型中存在的信息抽取效果不佳、抽取耗时较长等问题,提出设计知识数据库中非结构化文本关键信息抽取模型.利用六元组优化隐马尔可夫模型,取得模型发生概率,平滑处理不完整的训练样本;对不同时刻释放观察值序列展开初始化、终结操作,获取最优状态序列,经过解码观察序列后,对比得到正序解码序列与逆序解码序列,滤除无解码歧义的状态,完成歧义消除;根据解得的最大概率状态序列,明确所要抽取的文本关键信息,完成知识数据库中非结构化文本关键信息抽取模型设计.实验结果表明:采用所提模型抽取非结构化文本关键信息的效果较好,且耗时较短.
知识数据库;非结构化;文本关键信息;信息抽取;隐马尔可夫模型;最大概率状态序列
38
TP311(计算技术、计算机技术)
浙江省重点研发计划项目2020C03094
2021-11-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
357-360,394