基于自动编码特征的汉语解释性意见句识别
提出一种基于自动编码特征的汉语解释性意见句识别的分类方法.首先从汽车和手机两个领域的产品评论中构造一个解释性意见语料库,然后采用分类的方法进行解释性意见句识别.特别地,采用自动编码技术表示和学习解释性意见句分类的词向量特征.最后,在支持向量机框架下通过实验优选解释性词向量维度,并与一些传统特征表示方法进行比较.实验结果表明,与传统的卡方、信息增益和TF-IDF及其组合方法相比,自动编码特征的引入能有效提升汉语解释性意见句识别性能.
意见挖掘、解释性意见句识别、自动编码
51
TP391(计算技术、计算机技术)
国家自然科学基金61170148,60973081;黑龙江省人社厅留学人员科技活动项目和哈尔滨市科技创新人才研究专项2009RFLXG007
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
234-240