10.3969/j.issn.1672-9722.2012.02.006
基于统计的词语相关度网络自动构建方法研究
词语语义知识库对于扩大自然语言理解的深度具有重要的意义.目前较为成熟的WordNet、HowNet、同义词词林等均为人工开发,对知识的描述较为准确,但开发的工作量巨大,实际应用存在很多困难.为了更加自动化、实证性地获取中文词语相互关联状况的知识,该文提出词语相关度的概念以及基于统计的词语相关度计算方法,并以此为基础构建一个基于强领域特性中文词语的词语相关度网络,设计数组分割的硬盘存储方法,使该任务涉及到的海量数据的分析处理可以在目前的个人PC上完成.最终获得的词语语义知识具备经验主义方法的优点,准确性、泛化性较强,可以在文本分类、检索、过滤等领域发挥重要作用.
词语相关度、词语相关度网络、语义词典
40
TU352.11(建筑结构)
海军工程大学自然科学基金引导项目HGDYDJJ10008
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
15-18,86