基于复杂网络的汉语相似词挖掘和相似度计算研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3772/j.issn.1000-0135.2015.008.010

基于复杂网络的汉语相似词挖掘和相似度计算研究

引用
相似词是自然语言中普遍存在的现象,词汇相似度计算是情报学、自然语言处理和信息处理等领域的一项中间步骤.首先,基于大规模语料库构建了汉语词汇共现网络,进而利用复杂网络结构中节点相似的思想来计算词汇的相似度.其次,基于分布假设、上下文语境理论和词汇网络结构的特点,本文提出了基于贡献度折扣的词汇相似度计算方法,该方法不仅考虑了网络边的权重信息,还将节点的全局度特征融合进来.通过节点相似度实验发现,本文提出的基于贡献度折扣的相似度算法要明显好于共同邻居法、Jaccard方法和Salton 方法.最后文章就实验结果及其结论做了详细分析.

复杂网络、语料库、词汇相似度、语义相关度

34

TP3;G44

国家自科青年项目“基于CSSCI的句法级汉英平行语料库构建及知识挖掘研究”71303120;南京邮电大学引进人才科研启动基金“基于语料库的词汇相似度计算研究”NYS213008;南京邮电大学国自基金孵化项目“大数据时代下汉语词义知识挖掘研究”NY214112

2016-03-31(万方平台首次上网日期,不代表论文的发表时间)

共12页

885-896

相关文献
评论
暂无封面信息
查看本期封面目录

情报学报

1000-0135

11-2257/G3

34

2015,34(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn