10.11925/infotech.2096-3467.2021.0608
基于机器学习技术的自动引文分类研究综述
[目的]梳理和总结自然语言处理和机器学习技术在自动引文分类中的应用现状.[文献范围]在Scopus数据库以citation classification、citation polarity、citation function、feature selection等关键词为基础构建检索策略,筛选出代表性文献共46篇.[方法]从引文分类流程、引文分类任务、技术方法等角度对当前研究进行分析和评述,并探讨研究趋势和挑战.[结果]引文功能分类研究有从多分类向二分类转移的趋势;深度学习模型可以同时实现引文情感和功能分类;自动引文分类面临语料库学科单一、引用语境界定存在争议、分类数据不平衡性等问题.[局限]主要基于文献对自动引文分类研究进行评述,对产业界的分类系统和平台的调研覆盖不够.[结论]建议制定和完善关于代码、数据、语料等科研数据重用的评价方式,鼓励开放共享;结合引文分类和引文频次构建多维度的评价模型;基于用户的检索结果,智能化推荐支持该研究的文献或观点冲突的文献供进一步阅读.
自动引文分类;自然语言处理;引文内容分析;文本分类;机器学习
5
G353(情报学、情报工作)
CALIS全国医学文献信息中心项目CALIS;CALIS-2020-01-003
2022-02-28(万方平台首次上网日期,不代表论文的发表时间)
共11页
14-24