中文口语理解弱监督训练方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11772/j.issn.1001-9081.2015.07.1965

中文口语理解弱监督训练方法

引用
标注数据的获取一直是有监督方法需要面临的一个难题,针对中文口语理解任务中的意图识别研究了结合主动学习和自训练、协同训练两种弱监督训练方法,提出在级联框架下,从关键语义概念识别中获取语义类特征子集和句子本身的字特征子集分别作为两个“视角”的特征进行协同训练.通过在中文口语语料上进行的实验表明:结合主动学习和自训练的方法与被动学习、主动学习相比较,可以最大限度地降低人工标注量;而协同训练在很少的初始标注数据的前提下,利用两个特征子集进行协同训练,最终使得单一字特征子集上的分类错误率平均下降了0.52%.

意图识别、口语理解、弱监督训练、协同训练、主动学习

35

TP391.1;TP18(计算技术、计算机技术)

国家自然科学基金资助项目10925419,90920302,61072124,11074275,11161140319,91120001,61271426;中国科学院战略性先导科技专项XDA06030100,XDA06030500;国家863计划项目2012AA012503;中国科学院重点部署项目KGZD-EW-103-2;内蒙古师范大学“十百千”人才培养工程项目;内蒙古自然科学基金面上项目2012MS0930,2013MS0912;内蒙古自治区高等学校科学研究项目NJZY12032,NJZY028;内蒙古师范大学引进高层次人才科研启动经费项目2014YJRC036

2015-10-08(万方平台首次上网日期,不代表论文的发表时间)

共5页

1965-1968,1974

相关文献
评论
暂无封面信息
查看本期封面目录

计算机应用

1001-9081

51-1307/TP

35

2015,35(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn