10.3772/j.issn.1000-0135.2019.11.010
词汇表示学习研究进展
词汇语义表示是自然语言理解的基础.传统的基于语义词典的编码表示构建成本高昂,而独热表示又存在高维稀疏等缺点.词汇的分布式表示将词汇映射为低维稠密的实值向量,能有效捕捉词汇间的语义关联,是当前主流的表示技术.本文从数据特征、学习目标和优化算法三个方面,对现有的词汇表示学习方法进行了全面深入的分析,重点介绍了这些方法的理论基础、关键技术、评价指标及应用领域.此外,本文还总结了该方向面临的主要挑战以及最新研究进展,并对词汇表示学习未来的发展方向做了展望.
词汇表示、表示学习、词向量、分布式表示、深度学习
38
教育部人文社会科学研究青年基金项目"基于知识库和大规模文本的词汇语义表示研究"18YJCZH137;浙江省自然科学基金重点项目"个性化文本检索服务用户个人隐私保护方法研究"LZ18F020001
2019-12-03(万方平台首次上网日期,不代表论文的发表时间)
共19页
1222-1240