数据在产品分析中的应用
本文借助用户的评论和评分数据分析一系列的问题,帮助了解产品信息,分析客户评论行为.我们使用TF-IDF算法对文字评论进行了量化处理,对数据进行了初步处理,剔除了明显单一的特征数据,并对数据中的异常值进行了剔除,使用pearson相关性分析找出了最有使用价值的特征数据组,它们分别是星级,有益性评级,vine,确认购买,评论.我们使用多元线性回归模型研究了星级,评论与有益性评级之间的关系.分析发现星级与有益性评级为负相关关系,评论与有益性评级为正相关关系.由此可以判断星级高的评论不一定对客户的选择有帮助.
TF-IDF、相关系数、逻辑回归
2020-10-13(万方平台首次上网日期,不代表论文的发表时间)
共1页
221