10.3969/j.issn.1006-2475.2017.12.015
基于LDA模型和AP聚类的主题事件抽取技术
目前,事件抽取技术一般是对文本的事件信息进行直接抽取,忽略了文本的信息结构,并且抽取结果易受文本词语分布的影响.本文对文本的概念层级结构进行分析,并提出一种基于二次聚类并再划分的主题事件抽取方法.该方法可以提取文本的主题-事件层次化信息,并通过信息词的二次提取减小相关事件信息的干扰,优化抽取结果,并利用事件时间轴展示出事件的发展状态信息.实验结果表明本方法可以有效地提取文本的主题事件信息.
主题事件抽取、LDA主题模型、AP聚类、层次化信息、二次提取
TP391.1(计算技术、计算机技术)
2018-01-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
77-81,87