DOI：10.3969/j.issn.1003-0077.2010.01.014

跨领域倾向性分析相关技术研究

引用

摘要：

该文主要研究文本的倾向性分析问题,即判断文本中的论断是正面还是负面的.已有的研究表明,监督分类方法对倾向性分析很有效.但是,多数情况下,已有的标注数据与待判断倾向性的数据不属于同一个领域,此时监督分类算法的性能明显下降.为解决此问题,该文提出一个算法,将文本的情感倾向性与图排序算法结合起来进行跨领域倾向性分析,该算法在图排序算法基础上,利用训练域文本的准确标签与测试域文本的伪标签来迭代进行倾向性分析.得到迭代最终结果后,为充分利用其中倾向性判断较为准确的测试文本来提高整个测试集倾向性分析的精度,将这些较准确的测试文本作为"种子",进一步通过EM算法迭代进行跨领域倾向性分析.实验结果表明,该文提出的方法能大幅度提高跨领域倾向性分析的精度.

关键词：计算机应用、中文信息处理、跨领域、倾向性分析、图排序、EM算法

所属期刊栏目：24

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目60803085,60933005;国家863高技术研究发展计划基金资助项目2006AA010105-02,2007AA01Z416,2007AA01Z441;国家重点基础研究发展计划973资助项目2007CB311100

在线出版日期：2010-04-06（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：77-83

英文信息展示

期刊专题