主题标引文献的语义关系发现研究
[目的]利用文献的主题标引结果,发现其中隐含的重要语义关系.[方法]基于MEDLINE数据库中的生物医学主题标引文献,提出一种语义关系发现算法,涉及主题词组配原则、主题标引规则以及基于加权标引词和关系出现频次的优化方法等多个环节.[结果]收集疾病与症状方面的实验数据对算法进行实验验证,并结合领域专家审核,结果表明本文所发现语义关系的准确率可达到95%以上.[局限]本文所研究的语义关系发现算法仅适用于具有主题标引结果的文献.[结论]从大规模生物医学主题标引文献中发现中英文两种语言的语义关系是有效可行的,对其他领域语义关系的发现具有极高的借鉴意义.
语义关系发现、标引文献、组配原则、阈值
G250(图书馆学、图书馆事业)
本文系国家社会科学基金项目“基于复杂网络的公众健康知识网络构建研究”项目编号:15CTQ020和中央级公益性科研院所基本科研业务费项目“生物医学术语服务系统建设关键问题研究”项目编号:15R0109的研究成果之一.
2016-10-21(万方平台首次上网日期,不代表论文的发表时间)
87-93