10.3969/j.issn.1003-0077.2020.11.002
基于大规模语料库的介词结构搭配库构建
语言知识可帮助计算机正确地处理自然语言,介词结构知识作为语言知识的一种,对自然语言处理和语言教学研究有很重要的意义.该文基于大规模语料库构建了高质量的介词结构搭配库.首先在前人研究的基础上,对介词进行归类并建立了介词搭配知识体系,而后设计并实现了从大数据中获取介词结构搭配知识的规则,最后对抽取结果及其数据规模进行了统计和评估,主要目的是通过形式手段获取高质量的介词结构搭配,同时也为自然语言处理和语言学基础研究及应用提供数据支持.
语料库、知识抽取、介词结构搭配
34
TP391(计算技术、计算机技术)
国家重点研发计划"云计算和大数据"重点专项项目2018YFB1005105
2020-12-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
1-8