10.3969/j.issn.1007-130X.2018.06.022
基于弹幕情感分析和聚类算法的视频用户群体分类
随着数字媒体等技术的发展,出现了弹幕系统这种新型的评论模式并逐渐流行.它能够使视频观众即时发布关于视频情节内容的评论,也可以帮助观众理解视频内容.弹幕文本数据的产生,为短文本处理和实时数据处理提供了新的素材.研究弹幕数据的特点和其表达的情感,可以帮助我们更好地理解视频情节;研究弹幕内容之间的相似度进而分析用户之间的关联关系,不仅能够深入了解弹幕用户的特点、发掘不同视频之间的潜在联系,而且可以为视频制作时受众群体的选择提供更为准确的解决方案.首先将弹幕文本数据进行收集和预处理,然后计算这些文本的情感值.针对弹幕文本口语化的特点,建立了网络弹幕常用词词典.通过改进传统的k-means聚类算法,对所有发表弹幕的用户进行基于情感值的分类.这样的分类可以帮助我们了解观看特定类型视频的观众在情感上的异同点.
弹幕系统、短文本分析、时间序列、情感分析、用户分类
40
TP393(计算技术、计算机技术)
国家自然科学基金61572365,61503286,61702372;上海市自然科学基金15ZR1443000;上海市科技英才扬帆计划项目15YF1412600;上海市科委项目14DZ1118700;中央高校基本科研业务费专项资金
2018-07-30(万方平台首次上网日期,不代表论文的发表时间)
共15页
1125-1139