DOI：10.3969/j.issn.1006-9348.2008.08.075

基于语义相似度计算的词汇语义自动分类系统

引用

摘要：

词汇语义分类在文本聚类、信息检索、机器翻译等多个研究领域中拥有重要的理论及实践意义.介绍的知网语义相似度计算的词汇语义自动分类系统通过设计双向索引结构.高效的组织和挖掘了知网已有数据资源,并利用成熟的知网词语相似度计算方法,为词汇语义自动分类提供了不同于统计方法的新思路.目前系统的研究已取得实质性成果.在知网义原1564个分类的基础上,对知网提供的6万余条汉语常用词进行初步语义分类,进而开发了二次分类模块,针对初步分类结果进一步细化为适合实际需要的子类.实验结果证明该系统在分类性能上明显优于基于统计方法的分类系统,所作分类更加细腻、平滑.

关键词：词语相似度、语义分类、知网、双向索引结构

所属期刊栏目：25

分类号：TP391(计算技术、计算机技术)

在线出版日期：2008-11-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：295-299,307

英文信息展示

期刊专题