10.3969/j.issn.1002-0802.2020.04.015
面向文章流量预测的特征筛选与分析
探究微信公众号文章阅读量预测所需特征.首先,爬取目标公众号在指定期限内的所有文章,估计其阅读量达到稳定所需的时间,再对数据进行清洗.其次,通过包括分词模型、主题概率模型等多种技术和数据处理方法进行特征筛选,提取到文章及文章的标题、正文等包括词频、主题、文章发布情况等多种特征,构成125个变量.最后,通过假设检验探究所提取特征与阅读量之间的关系,分析并为公众号提供具有指导意义的文章流量影响因素.
文本数据挖掘、中文分词、主题概率模型、特征筛选、假设检验
53
TN919.8
2020-04-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
885-889