10.3969/j.issn.1000-3428.2015.05.033
基于混合主题模型的文本蕴涵识别
分析识别文本蕴涵的主流方法,并基于文本T和假设H可以从潜在混合主题中生成的猜想,提出一个混合主题模型来识别文本蕴涵,描述一个在混合主题模型上生成文本的概率模型。该模型把文本T和假设H看成是同一语义的不同表达,表示为多模式的数据,若文本T和假设H有蕴涵关系,则它们有相似的主题分布,共享混合词汇表和主题。设计mixLDA和LDA模型的对比实验,并对RTE-8任务进行测试,通过支持向量机对得到的句子相似度和其他词法句法特征进行分类。实验结果表明,基于混合主题模型的文本蕴涵识别具有较高的准确率。
文本蕴涵、主题模型、多模式、混合主题、隐藏语义、支持向量机
TP391.1(计算技术、计算机技术)
国家自然科学基金资助面上项目“汉语文本推理的资源建设和统计分析研究”61173062。
2015-05-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
180-184