10.16208/j.issn1000-7024.2018.11.024
基于层次化的微博情绪分类——以新浪微博为例
针对当前大多微博情绪分析算法难以准确描绘不同情绪差异的问题,对中文微博的情绪成分和层次化情绪分类进行研究.预处理消除非情绪信息,引入ICTCLAS分词工具包对文章进行分割,提取形容词、名词和动词等,形成特征,使用卡方测试、词频和点互信息(PMI)对特征进行选择,运用支持向量回归(SVR)和规则集进行分类.数据集采用新浪原始中文微博,不同分组之间的实验结果验证了该方法的有效性,其在多个层次上的F测度等值优于其它同类方法,随机挑选50篇微博进行评判,近一半的结果得到所有评判员的支持.
微博、情绪分类、点互信息、情绪成分分析、支持向量回归
39
TP391(计算技术、计算机技术)
天津市基础研究计划基金项目14JCTPJC00553;天津市高等学校科技发展基金计划基金项目20130711
2019-01-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
3431-3437