微博观点句识别的话题影响研究
为了从海量的网络信息中迅速准确地获取评价信息,观点句识别已经成了自然语言处理的一个研究热点。现在观点句识别系统大都是基于机器学习的方法,一般使用机器学习的方法来进行分类会受到领域差异性影响。针对这个问题,该文对微博观点句识别系统是否会受到微博话题影响做了经验性研究,同时为了弥补训练数据的不足,该文通过规则方法自动标注网络数据进行了训练集的扩充。实验结果表明,微博话题间存在差异,进行分话题模型训练可以提升微博观点句识别系统的性能。
观点句识别、机器学习、话题、规则
TP18(自动化基础理论)
国家自然科学基金项目61005052;国家科技支撑计划课题2012BAH14F03;中央高校基本科研业务费专项资金2010121068;福建省自然科学基金项目2011J01369
2014-02-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
123-127