10.3969/j.issn.1673-629X.2014.07.021
使用网络搜索引擎计算汉语词汇的语义相似度
汉字词语的语义相似度计算是中文信息处理中的一个关键问题。文中利用网络搜索引擎提供的信息来计算汉语词对的语义相似性。首先通过程序访问搜索引擎,获取汉字词汇的搜索结果数,并依此实现了相似度计算模型WebPMI;然后描述了根据查询返回的文本片段进行语义相关性分析的模型CODC;最后,结合这个两个模型,给出了文中算法的伪代码。实验结果显示,文中的算法较好地利用了互联网信息,实现了一种较新的汉语词汇语义相似度计算方法,接近于利用词典提供的信息计算相似度的传统算法。
相似度、搜索引擎、词典
TP301.6(计算技术、计算机技术)
湖北省自然科学基金2013CFB310;湖北教育科研项目B2013205;湖北省高等学校2013年省级大学生创新创业训练计划项目2013CXZD027;2013年武汉纺织大学大学生创新创业训练计划项目2013CXXL008,2013CXXL009
2014-08-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
84-87,91