面向词性标注的多资源转化研究
利用多资源转化方法进行词性标注研究,旨在将源端资源的标注进行转化,以符合目标端标注规范,进而将转化后的资源与目标资源合并,增大训练数据规模.做了两方面创新:在转化过程中,额外利用指导特征的置信度信息;在转化后的资源中,用模糊标注表示方法减少错误标注.实验表明,利用置信度信息能有效帮助转化,而模糊标注表示方法的影响不大.
词性标注转化、条件随机场、词性标注
51
TP391(计算技术、计算机技术)
国家自然科学基金61373095,61273319;江苏省博士后基金1401075B;江苏省自然科学基金青年基金BK20140355
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
328-334