大规模英汉平行语料库的检索与应用:大数据视角
本研究从大数据视角报告“大规模英汉平行语料库检索平台”的设计开发及其应用.首先,梳理了语料库检索问题中方法和技术的发展脉络;其次,介绍了面向一亿词级别英汉平行语料库检索的“大规模英汉平行语料库检索平台V2.0”的功能,该平台不仅具备单语检索、双语检索和搭配分析等基本功能,也提供元信息过滤、词形还原、模糊检索和支持正则表达式和通配符的ProConc语言的半结构化复杂检索等功能,可快速准确地从语料库中抽取信息,为基于英汉平行与历时类比语料库的翻译研究、翻译教学和双语词典编纂提供数据基础;第三,对比分析本研究所设计的方法与技术较之传统平行语料库检索技术的优势,分析了平台在实际语料库检索中的信度,借此为大数据背景下语料库的信息抽取研究提供借鉴.
平行语料库、历时类比库、语料库检索、大数据
H319.3(英语)
国家社会科学基金10ZD&127
2018-04-28(万方平台首次上网日期,不代表论文的发表时间)
共9页
3-11