DOI：10.3969/j.issn.1000-3428.2015.05.033

基于混合主题模型的文本蕴涵识别

引用

摘要：

分析识别文本蕴涵的主流方法，并基于文本T和假设H可以从潜在混合主题中生成的猜想，提出一个混合主题模型来识别文本蕴涵，描述一个在混合主题模型上生成文本的概率模型。该模型把文本T和假设H看成是同一语义的不同表达，表示为多模式的数据，若文本T和假设H有蕴涵关系，则它们有相似的主题分布，共享混合词汇表和主题。设计mixLDA和LDA模型的对比实验，并对RTE-8任务进行测试，通过支持向量机对得到的句子相似度和其他词法句法特征进行分类。实验结果表明，基于混合主题模型的文本蕴涵识别具有较高的准确率。

关键词：文本蕴涵、主题模型、多模式、混合主题、隐藏语义、支持向量机

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金资助面上项目“汉语文本推理的资源建设和统计分析研究”61173062。

在线出版日期：2015-05-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：180-184

英文信息展示

期刊专题