基于密度Canopy的评论文本主题识别方法
融合 Sentence-BERT 和 LDA 的评论文本主题识别(SBERT-LDA)方法,将 LDA 的主题数作为K-means算法中的k 值,导致算法可解释性较差、主题一致性较低.为了解决上述问题,提出基于密度 Canopy 的 SBERT-LDA 优化方法(SBERT-LDA-DC),利用密度 Canopy 改进 K-means算法.实验结果表明,提出的方法在一致性指标上要优于使用 K-means 以及 K-means++对特征向量聚类的同类方法;与SBERT-LDA方法相比,在 1 852 条戏剧评论数据集上,一致性指标值提高了 22.9%.因此,所提出的 SBERT-LDA-DC 方法是有效的,对产品或服务提供者更好地了解用户意见、完善自身产品或提升服务水平提供了新方法,具有较强的实际应用价值.
自然语言处理、主题识别、评论文本、Sentence-BERT、LDA
44
TP393(计算技术、计算机技术)
国家文化;旅游科技创新工程项目;河北省省级科技计划资助项目;河北省省级科技计划资助项目
2023-11-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
493-501