DOI：10.3969/j.issn.1671-1122.2013.10.052

基于机器学习的中文评论倾向性分类实证研究

引用

摘要：

文章对长度短、变形词多的中文评论的倾向性分类问题做了深入研究，分析了目前比较流行的几种算法，其中特征选取方法选取了卡方统计量（CHI）、信息增益（IG）、互信息（MI）；分类算法选取了K最邻近节点（KNN）方法、支持向量机（SVM）方法、朴素贝叶斯（Naive Bayes）方法。通过两两组合进行实验，最终的实验结果表明，特征选取方法采用IG，分类算法采用Na?ve Bayes效果较为理想。

关键词：倾向性、机器学习、特征选择、特征项权重

分类号：TP309(计算技术、计算机技术)

资助基金：国家高技术研究发展计划863计划2011AA010702

在线出版日期：2013-11-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：164-166

英文信息展示

期刊专题