面向学术文献的作者名消歧方法研究综述
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11925/infotech.2096-3467.2020.0384

面向学术文献的作者名消歧方法研究综述

引用
[目的]分析并评述面向学术文献的作者名消歧的相关工作,为该领域的后续研究提供借鉴.[文献范围]在Web of Science、谷歌学术、中国知网和万方数据库中检索2016年1月1日至2020年3月28日的相关研究,共选择51篇文献进行综述.[方法]以作者名消歧的流程为主线系统梳理各项研究成果,分类总结特征提取、特征表示以及模型训练与预测等主题的研究,并针对研究中的共性问题进行多维度的讨论.[结果]在特征表示方面,相较于2016年之前的研究,基于图、概率和混合模型的方法优化了复杂特征的相似度计算.在模型训练与预测方面,基于机器学习的算法仍需要提高效率与泛化能力,使其能够满足大型数据库和增量消歧的需求.多数研究尚未解决数据中存在的诸如训练数据不均、特征数据缺失、一人多名等问题.[局限]由于各项研究的实证数据差异较大,未能对不同方法进行量化比较.[结论]提出从多源数据融合、用户干预以及预训练模型的引入等视角开展后续研究的思路.

作者名消歧、姓名歧义、重名消歧、文献数据库

4

TP393;G250(计算技术、计算机技术)

本文系国家社会科学基金重大项目“中国近现代文学期刊全文数据库建设与研究1872-1949”项目编号:17ZDA276的研究成果之一

2020-11-12(万方平台首次上网日期,不代表论文的发表时间)

共13页

15-27

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

4

2020,4(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn