10.3969/j.issn.1000-0135.2007.01.012
基于SOM的语义词典自动构建实验研究
语义词典在语言学和自然语言处理研究中占有相当关键的位置.语义词典的构造,通常有两类做法.一类是基于语言学家的主观判断,另一类则是基于机器的自动聚类.后者是本文所要研究的主题.本文基于大规模的语料库,利用自组织映射神经网络(SOM)对词典进行无监督的自动构造.首先从语料库中抽取待聚类词的上下文窗口中的词,并利用信息增益(Information Gain)对特征词进行选择,然后借鉴信息检索模型中的TFIDF计算特征向量中每一个特征的特征权重,最后将构造好的待聚类词的特征向量作为SOM的输入,经过网络的迭代计算将不同类别的词映射在SOM输出网格的不同结点.
词典、自组织映射、上下文窗口、信息增益
26
G35(情报学、情报工作)
国家自然科学基金60321002
2007-03-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
77-83