10.3969/j.issn.1000-1220.2018.04.022
语义约束和时间关联LDA的社交媒体主题词链提取
网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约束和时间关联提出了主题词链提取算法及模型.首先利用句法分析、词性关系和语境相关等进行词语语义关系获取,然后将语义和时间嵌入到LDA主题模型,构建符合中文社交媒体文本语法、语义结构特点的动态主题词链提取模型.实验结果表明,该模型可以改善LDA模型的语义理解功能和主题捕捉能力,提高主题词链提取的准确率和召回率.
社交媒体、主题模型、语义约束、LDA模型、时间关联
39
TP311(计算技术、计算机技术)
国家自然科学基金项目61662032,61462040;江西省高校人文社科项目TQ1505,JC1544
2018-04-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
742-747