一种基于双通道 LDA 模型的汉语词义
语义记忆是人类理解自然语言的基础。人类理解语言的过程可以看作是对词义进行编码、对语义记忆进行检索,进而对词义进行解码的过程。因此,对词义进行合理地表示是计算机理解语言的关键步骤。该文总结分析了已有的词义表示方法与人脑词义表征的关系,针对汉语词汇的歧义现象,重点阐述了如何从歧义词所处的上下文中最大限度地自动获取关于歧义词的词义信息,并将这些信息整合,通过一系列的特征集合表示歧义词的词义。具体地说,该文将出现在歧义词上下文语境中有明确含义的实词作为模型的输入,同时在上下文中获取可以表示歧义词词义的其他特征,最终将这两种信息通过贝叶斯概率模型整合在一起,共同实现歧义词的词义表示和归纳。实验表明,该文提出的方法可以得到更好的词义表示和归纳效果。
词义表示、词义归纳、词义消歧、主题模型、双通道主题模型
39
TP391(计算技术、计算机技术)
国家自然科学基金61333018;中国科学院战略性先导科技专项B类课题XDB02070007资助.
2016-08-24(万方平台首次上网日期,不代表论文的发表时间)
共15页
1652-1666