10.3969/j.issn.1003-0077.2011.01.018
面向单一双语网页的双语资源挖掘方法
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要.该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包舍双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源.实验结果表明,该方法能够有效改进双语资源挖掘的质量.
Web挖掘、网页分类、双语资源、频繁序列模式、支持向量机
25
TP391(计算技术、计算机技术)
辽宁省教育厅科研项目资助LT2010084
2011-06-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
110-115