词汇分布语义的语言学基础探微
词汇分布表示是当前人工智能领域语义表示的主要方法.通过对大规模语料中词汇分布规律的学习,可以得到以数学向量形式表示的词汇,并具有语义可计算和可推导的重要性质.词汇分布语义表示的语言哲学基础是维特根斯坦的词义使用论,主张词的意义就在于使用.维特根斯坦和索绪尔的语言观有着某种联系,索绪尔认为,语言中一切要素都按照句段关系和联想关系运行,词汇分布语义模型的输入上下文事实上可以归为这两类关系.布龙菲尔德的结构语言学深受索绪尔的影响,最终发展成为海里斯的分布方法论,构成了词汇分布语义的语言学基础.当前以神经语言模型为代表的词汇分布语义,根植于词义使用论学说,并以描写语言学为理论支撑,其本质是对语料中词汇使用模式和偏好的反映,因此可以客观折射社会文化生活的某些特征,同时也不可避免地存在其固有的局限性.
词义、分布语义、自然语言理解、结构主义、描写语言学
教育部人文社会科学研究青年基金项目“基于知识库和大规模文本的词汇语义表示研究”;浙江省自然科学基金重点项目
2020-01-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
99-104