基于词频均值波动和概率语言模型的 短文本热点主题探测研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1002-1965.2019.06.023

基于词频均值波动和概率语言模型的 短文本热点主题探测研究

引用
[目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角.[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,再对二者结果集合进行相似度计算实现热点主题的探测与展示.[结果/结论]通过对较高热度噪声词的过滤以及热点事件词的发现实现热点主题的探测.通过对比谷歌趋势的结果,准确率达到82.67%,证明模型有效.本研究对短文本热点主题探测的理论和实践研究具有一定参考价值.

短文本、热点主题探测、词频均值波动模型、概率语言模型

38

G356.8(情报学、情报工作)

国家社会科学基金重点项目"大数据环境下的计算型情报分析方法与技术研究"14ATQ005;国家社会科学基金重大项目"大数据时代知识融合的体系架构、实现模式及实证研究"15ZDB129

2019-06-21(万方平台首次上网日期,不代表论文的发表时间)

共7页

152-158

相关文献
评论
暂无封面信息
查看本期封面目录

情报杂志

1002-1965

61-1167/G3

38

2019,38(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn