10.3969/j.issn.1002-1965.2016.12.010
基于DTPM模型的话题热度预测方法
[目的/意义]随着网络舆情对现实生活的影响越来越大,对其中一些具有负面影响的话题进行追踪与预测具有重要意义。由于微博话题热度时间序列非线性、时变性等特征,因此目前的研究难以对其进行较为理想的预测。[方法/过程]为了提高话题热度预测精度,在LDA和EEMD方法基础上提出了离散话题热度预测模型DTPM ( Discretized Topic Predict Model)模型。首先,引入LDA模型,结合话题具有的内容和外在特征两个方面的热度因素,定义更加符合实际的话题热度计算方法,得到话题热度时间序列。然后,采用EEMD技术对该热度时间序列进行离散分解,利用神经网络等预测方法对各部分进行预测建模,最终汇总得到话题预测结果。[结果/结论]基于真实微博数据进行话题热度预测仿真实验,对比了话题热度时间序列不同处理下的预测精度。试验结果表明,对话题热度时间序列进行离散化的DTPM模型能够有效提高话题热度预测的精度。
话题热度时间序列、LDA、EEMD、DTPM模型
35
TP391(计算技术、计算机技术)
国家自然科学基金项目“基于演化本体的网络舆情自适应跟踪方法研究”71373123;江苏高校哲学社会科学研究重点项目“基于超网络的江苏教育微博舆情多元意见演化模型及应用研究”2015ZDIXM007;高校基本科研业务费重大项目培育基金“基于‘模型-数据双驱动’的复杂社会网络行为大数据分析方法研究”NP201630X研究成果之一。
2017-02-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
52-57