10.3321/j.issn:1005-3026.2003.01.007
基于统计的汉英法律文献亚句子级对齐
基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个.提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布.参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差.实验结果表明汉英法律文献亚句子级对齐的正确率为98.8%,召回率为99.2%.
双语语料库、汉英法律文献、亚句子级对齐、统计方法、评价函数、参数计算、标准正态分布
24
TP391.2(计算技术、计算机技术)
国家自然科学基金60083006;国家重点基础研究发展计划973计划G19980305011
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
23-26