10.3969/j.issn.1002-1965.2023.04.022
基于SMOTE-RF与多维特征向量的在线商品虚假评论识别研究
[研究目的]通过从评论文本和评论者两个维度对在线评论的特征进行挖掘,探究电商平台如何有效提高虚假评论识别的准确性,增加用户在线商品评论可信度,为消费决策提供参考.[研究方法]提出一种基于多维特征和SMOTE-RF模型的虚假评论识别方法.首先,通过识别商品虚假评论线索,构建多维特征向量,引入情感极性等特征并进行单调化处理;其次,在评分偏离度中添加了商品得分均值等统计指标来全面刻画虚假评论;最后,针对在线评论数据集中真实评论与虚假评论类不平衡问题,运用SMOTE算法优化随机森林分类模型,从而达到提高虚假评论识别准确性的目的.[研究结论]实验结果显示该方法在正负样本不平衡的虚假评论识别中具有更高的准确率、召回率及F1值.其中评分偏离度特征对虚假评论识别的影响最大,情感极性可作为识别的次要参考特征.因此,综合考虑在线评论多维特征和正负样本不平衡可帮助电商平台对虚假评论进行有效的过滤,为消费者提供更为可靠的评论数据.
在线商品、多维特征、虚假评论、评论文本、随机森林、SMOTE过采样
42
TP391.1(计算技术、计算机技术)
陕西省自然科学研究计划项目;陕西省教育厅智库项目
2023-04-23(万方平台首次上网日期,不代表论文的发表时间)
共9页
156-164