10.3969/j.issn.1000-3428.2014.10.026
基于区分性关键词模型的维吾尔文本情感分类
在研究区分性关键词提取方法的基础上,对维吾尔语中的生气和高兴等常见情感类型进行基于文本句子的情感分类研究。结合维吾尔文本句子中的情感表达特点,以词频和文档频率作为基本统计量,通过计算同一词语在不同组合统计量下的类间差异得到区分性关键词,并基于这些关键词进行特征提取和区分性情感模型构建。从维吾尔语电影字幕、小说等文本库中提取生气和高兴2种情感构造实验数据集,并验证所提出的情感分类方法。实验结果表明,基于区分性关键词的建模方法能有效地对维吾尔文本句子进行情感分类。
维吾尔语、区分性、文本句子、情感分类、差异性统计量
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61065005,61163033;教育部新世纪优秀人才支持计划基金资助项目NCET-10-0969;新疆维吾尔自治区高新技术研究发展计划基金资助项目201312103。
2014-10-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
132-136,142