10.15913/j.cnki.kjycx.2021.02.009
面向"智慧政务"文本挖掘的研究
主要探讨智慧政务平台留言热点问题的挖掘及排名问题,为解决该问题,建立了文本聚类模型,并进行了主成分分析.通过对文本数据的预处理,由词汇-文本矩阵的奇异值分解对向量语义化,潜在语义分析对文本向量进行语义空间降维,再计算文本的余弦相似度,结合K-means聚类算法建立文本聚类模型,实现热点问题的挖掘,并按热点汇编.对已挖掘的热点进行主成分分析,以热点的留言数、留言时间密集度、点赞数、反对数为评价指标.以指标的信息贡献率为权重计算主成分综合得分,以此为热度指数,对热点问题进行排名.最后给出了实例分析.
向量语义化、LSA、余弦相似度、K-means聚类
TP391.1(计算技术、计算机技术)
国家自然科学基金项目"图中包含特定元素的子图结构研究"编号:NSFC11771172
2021-04-02(万方平台首次上网日期,不代表论文的发表时间)
共5页
29-32,36