10.3969/j.issn.1000-0429.2002.03.004
自然语言处理技术的三个里程碑
半世纪以来自然语言处理(NLP)研究取得两点重要认识和三大重要成果,即认识到:(1)对于句法分析,基于单一标记的短语结构规则是不充分的;(2)短语结构规则在真实文本中的分布呈现严重扭曲.换言之,有限数目的短语结构规则不能覆盖大规模语料中的语法现象.这与原先的预期大相径庭.NLP技术的发展在很大程度上受到这两个事实的影响.从这个意义上说,本领域中称得上里程碑式的成果是:(1)复杂特征集和合一语法;(2)语言学研究中的词汇主义;(3)语料库方法和统计语言模型.大规模语言知识的开发和自动获取是NLP技术的瓶颈问题.因此,语料库建设和统计学理论将成为该领域中的关键课题.
自然语言处理、复杂特征集、词汇主义、语料库方法、统计语言模型
34
H087(应用语言学)
2005-10-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
180-187