10.3969/j.issn.1674-9456.2020.12.006
基于TF-IDF的社交电商文本信息分类研究
近年来,随着社交电商的发展,网络零售呈去中心化的发展趋势,构建社交电商用户画像对精准营销、智能推广有较大现实意义.文章以多年小微商户经营数据为基础,首先将原始信息进行筛选、清洗、标注等预处理操作,以得到标签化、向量化的训练数据.然后,基于词袋模型,使用TF-IDF与CHI特征选择方法,以及朴素贝叶斯等分类器进行模型构建,并从多维度进行模型优化.实验结果表明,该模型在验证集上表现优秀,准确率可以达到95%以上,且运行开销较低、速度较快,是社交电商用户画像重要的一环,具备一定应用场景和实用价值.
计算机科学与技术、机器学习、自然语言处理、文本分类
11
TP181(自动化基础理论)
2021-03-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
32-38