DOI：10.3969/j.issn.1003-0077.2011.01.018

面向单一双语网页的双语资源挖掘方法

引用

摘要：

双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要.该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包舍双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源.实验结果表明,该方法能够有效改进双语资源挖掘的质量.

关键词：Web挖掘、网页分类、双语资源、频繁序列模式、支持向量机

所属期刊栏目：25

分类号：TP391(计算技术、计算机技术)

资助基金：辽宁省教育厅科研项目资助LT2010084

在线出版日期：2011-06-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：110-115

英文信息展示

期刊专题