10.19722/j.cnki.1008-7729.2021.0039
基于SGC-LDA的微博用户兴趣主题演化研究
针对传统的用户兴趣主题模型存在非动态、噪声性、计算复杂度高和兴趣演化分析维度单一等问题,基于滑动窗口技术,引入兴趣主题遗传因子保持主题连续性,并定义用于捕获通用语义和噪声干扰词的兴趣通用主题.提出了SGC-LDA(sliding-window,genetic factor and common topic-latent dirichlet allocation)用户兴趣主题模型,并根据该模型对数据集进行主题演化分析,从兴趣主题强度、兴趣主题状态和兴趣主题路径三个维度分析用户的兴趣偏好及演化规律.运用新浪微博语料文本进行实证分析,结果表明,SGC-LDA用户兴趣主题模型优于传统的LDA主题模型,可以准确描述用户兴趣演化规律,漏报率、误报率以及归一化开销均低于未进行主题关联过滤的基准(Baseline)方法,从而证明了模型的有效性.
用户兴趣;主题演化;隐狄利克雷分配模型;演化关系;微博
23
TP391.1(计算技术、计算机技术)
教育部人文社会科学研究规划基金资助项目17YJA870006
2021-09-23(万方平台首次上网日期,不代表论文的发表时间)
共14页
28-41