10.13266/j.issn.0252-3116.2020.04.011
中文文献题录数据机构名称归一化研究
[目的/意义]大数据时代,机构名称数据呈现海量性、动态性、多样性等新特征,机构名称归一化可改善大数据环境下科研管理、学科评价、学科服务中的数据可靠性,提升基于机构名称的数据检索质量和应用效果.[方法/过程]从语言学角度和模型构建层面研究机构名称归一化,构建基于共现关系和相似度的机构名称归一化框架模型,提出机构名称实体边界识别方法,编制机构多层级词表,提出机构名称归一化方法,最后选取2008-2018年中文文献题录数据进行实验.[结果/结论]实验结果验证了模型的有效性,对其他类型机构名称归一化有一定的启发.
机构名称、归一化、模型构建、大数据、实体边界识别
64
G254(图书馆学、图书馆事业)
2020-11-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
95-102