10.3969/j.issn.1000-1220.2021.04.008
混合粒度多视图新闻数据聚类方法
网络新闻内容除了直接的文本信息之外,通常还使用高度语义概括后的标签信息对新闻中出现的图片、音视频等多媒体信息进行描述,使得新闻内容中出现了不同语义层次、不同粒度的内容概念(直接的文本特征与标签特征)描述.文本特征维度通常较高,导致特征数较少的视图在聚类中的作用被弱化.同时,各个视图对聚类簇结构的贡献程度不一样.针对以上两个问题,本文首先在每个单独的视图上,进行混合粒度的统一操作(针对不同粒度进行统一的标签生成处理);在此基础上,借助信息熵良好的不确定性表示特性,对不同的视图进行加权融合,最后进行聚类操作.不同数据集的仿真实验证明了本文所提方法的有效性和可行性.
混合粒度、新闻数据、多视图聚类、视图权重
42
TP391(计算技术、计算机技术)
国家自然科学基金项目;重庆市自然科学基金基础研究;前沿探索项目
2021-05-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
719-724