10.11959/j.issn.1000-0801.2016238
基于对话内容的交互型文本会话主题挖掘
传统的主题挖掘模型一般仅从交互型文本中挖掘出文档主题,为了能够从中挖掘出会话主题并提高挖掘模型的普适性,提出了一种基于对话内容的交互型文本会话主题生成模型.首先通过分析交互型文本的特征,基于主题树的概念,定义了一个5层结构的对话生成树.以此为基础,再基于LDA构建会话主题生成模型(ST-LDA).最后采用吉布斯抽样法对ST-LDA进行推导,得到会话主题及其分布概率.使用实际数据进行验证,结果表明,ST-LDA模型可以从交互型文本中有效地挖掘出会话主题.此外,成果可以降低分类算法的复杂度,回溯主题一参与者关联关系,具有较好的普适性.
交互型文本、对话内容、会话主题挖掘、对话生成树、LDA
32
TP181(自动化基础理论)
国家自然科学基金资助项目61163005;江西省科技计划基金资助项目2014ZBBE50008;The National Natural Science Foundation of China61163005;Science and Technology Program of Jiangxi Province of China2014ZBBE50008
2016-10-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
139-145