10.3969/j.issn.1000-3428.2009.14.093
双语平行网页挖掘系统的设计与实现
针对双语语料是开发统计机器翻译系统的重要资源,提出一种从网络中自动挖掘双语平行网页的方法.与传统从指定网站中挖掘平行网页的方法不同,该方法从整个互联网中自动挖掘平行网页,对新的语言对和内容领域有很强的适应能力,实现双语平行网页挖掘的系统.实验结果显示,该系统可以为统计机器翻译系统提供大量高质量的平行网页.
自然语言处理、统计机器翻译、双语语料、网络挖掘
35
TP312(计算技术、计算机技术)
2009-08-19(万方平台首次上网日期,不代表论文的发表时间)
共3页
267-269