10.3969/j.issn.1673-6036.2022.12.007
融合多策略的中文科技文献机构名称规范化研究与实践
分析中文科技文献中机构著录项的组织特点和中文机构名称的命名特点,详细阐述常见机构名称规范化方法、中文科技文献机构名称规范化处理流程,提出利用字符串匹配词典和规则过滤等方法提取规范化的机构名称,并基于机构-作者共现关系,计算作者共现率,结合绝对共现量和共现率阈值实现机构实体的消歧,能够有效匹配同一机构的不同表现形式.
机构名称规范、科技文献、作者共现、实体挖掘
43
R-058(一般理论)
中国工程科技知识中心建设项目;国家社会科学基金
2023-03-07(万方平台首次上网日期,不代表论文的发表时间)
共7页
32-38