10.3969/j.issn.1000-565X.2012.08.014
基于时空情境模型的主题跟踪
针对现有的主题模型不能随时空情境准确反映主题的周期变化和空间分布的问题,根据互联网信息通常包含发布时间地点等情境数据的特点,提出一种用于主题跟踪的时空情境主题模型.首先将数据集的多主题分布与时空信息关联起来建立时空情境主题模型,对主题周期和强度进行描述;然后通过EM算法估计模型参数,利用该参数分别计算主题快照和主题周期;最后利用时序相似度计算判断后续主题信息,实现主题跟踪.食品安全事件主题跟踪的实验表明:与单纯依赖文本特征的主题跟踪方法相比,文中提出的方法能够明显提高跟踪效率和多个主题的跟踪准确性,这有助于进一步实现精准的主题信息检索.
主题模型、情境、生成模型、概率分布、文本处理
40
TP391(计算技术、计算机技术)
国家自然科学基金资助项目91024001,61070142;北京市自然科学基金资助项目4111002
2012-11-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
82-87