基于级联重排序的汉语音字转换
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3724/SP.J.1004.2014.00624

基于级联重排序的汉语音字转换

引用
N 元语言模型是解决汉字音字转换问题最常用的方法。但在解析过程中,每一个新词的确定只依赖于前面的邻近词,缺乏长距离词之间的句法和语法约束。我们引入词性标注和依存句法等子模型等来加强这种约束关系,并采用两个重排序方法来利用这些子模型提供的信息:1)线性重排序方法,采用最小错误学习方法来得到各个子模型的权重,然后产生候选词序列的概率;2)采用平均感知器方法对候选词序列进行重排序,能够利用词性、依存关系等复杂特征。实验结果显示,两种方法都能有效地提高词N 元语言模型的性能。而将这两种方法进行级联,即首先采用线性重排序方法,然后把产生的概率作为感知器重排序方法的初始概率时性能取得最优。

汉语音字转换、重排序、最小错误学习、感知器方法

TP3;H12

国家科技部重大科技专项2011ZX03002-004-01;深圳市基础研究重点项目JC201104210032A, JC201005260112A资助@@@@Supported by Key Science and Technology Projects of the Min-istry of National Science and Technology2011ZX03002-004-01;Shenzhen Basic Research Key ProjectJC201104210032A, JC201005260112A

2014-05-15(万方平台首次上网日期,不代表论文的发表时间)

共11页

624-634

相关文献
评论
暂无封面信息
查看本期封面目录

自动化学报

0254-4156

11-2109/TP

2014,(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn