10.3778/j.issn.1673-9418.1305045
微博网站中面向主题的权威信息搜索技术研究
针对微博信息的稀疏性和时效性,研究了微博网站中面向主题的权威信息搜索问题。通过提取微博隐主题方法,缓解了微博文本信息数据稀疏性的问题;通过两阶段聚类算法,将微博网站中的信息按主题进行聚类,加快了微博信息搜索时间;提出了一种微博网站中面向主题权威信息的排序模型,该排序模型结合 KL-divergence 语言模型的伪相关反馈技术和时间因子来对微博信息进行排序,并利用第一次检索到的首页信息中转发次数较高的微博信息进行查询扩展。在新浪微博的真实数据集上的实验结果表明,提出的隐主题模型可以较好地解决微博数据稀疏性问题,并且权威信息排序模型相对于其他排序算法,在微博网站中进行信息搜索有更好的效果。
微博网站、隐主题、聚类、权威信息
TP391.3(计算技术、计算机技术)
The National Natural Science Foundation for Young Scientists of China under Grant No.61202074;the Natural Science Foundation of Beijing of China under Grant No.4122007
2013-12-10(万方平台首次上网日期,不代表论文的发表时间)
共11页
1135-1145