10.13718/j.cnki.xsxb.2014.07.021
文本分类中的主动多域学习
现有主动学习主要着眼于对单个域训练方法的研究,不同域有不同的特征,同时也存在一些隐含的共性。如何从多个域中选择合适数据样本成为多域学习中减少人工标注工作量的关键。本文提出了一个新颖的主动多域学习框架,该框架充分考虑了重复信息,并可从多个域中选择合适的数据样本。该框架首先找到一个包含不同域间隐含共性的共享子空间,然后将所有数据样本分解为公共域部分和个性域部分,其中公共域部分可视为域间的重复信息,该部分在查询时需要被考虑到。最后,将主动多域学习方法与最新的主动学习方法的性能进行了比对,实验结果表明,本文提出的主动多域学习方法在减少人工标注工作量方面有显著作用。
主动学习、多域学习、隐含共性、共享子空间
TP311(计算技术、计算机技术)
2014-08-05(万方平台首次上网日期,不代表论文的发表时间)
共7页
108-114