10.3969/j.issn.1002-1965.201706274
基于医学主题词共现网络的链接预测研究
[目的/意义]共词网络作为一类特殊的科学知识网络,不仅能从微观层面揭示科学知识体系内部的实体关系特征,还能以其演化过程反映科学知识概念的增长规律.但目前对于共词网络的研究大多集中于"描述"阶段.对医学主题词的共现网络进行链接预测研究,试图找到一种新的预测科学发展方向的途径.[方法/过程]构建以医学主题词/副主题词为节点的共词网络,抽取没有共现关系的主要主题词/副主题词词对为研究样本,计算各个词对的公共近邻、最短路径等属性值.利用朴素贝叶斯、SMO、J48决策树3种分类算法,对词对的共现关系进行预测,并通过属性选择对各属性的重要性进行排序.[结果/结论]3种算法中朴素贝叶斯算法得到了正确预测的共现词对.资源配置指标及Adamic-Adar指数的加权形式指标在预测中起到了更重要的作用.通过链接预测技术,预测两个词在下一个时段是否能够共现,是预测科学发展方向和知识发现的一种新尝试.
链接预测、共词网络、机器学习、知识发现
37
G250(图书馆学、图书馆事业)
2018-02-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
66-71,52