10.13663/j.cnki.lj.2022.05.013
基于BERT和分面分类的多标签的南海证据性数据分类研究
为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了南海文献分类法,应用BERT预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通过数据库技术将南海证据性数据分为12个面进行组配检索.通过以上方法赋予每一条南海证据性数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类.从更细粒度的视角,实现数据分类,与粗放式文献载体的分类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角,是科学研究创新的基础和保障.
BERT、分面分类、数据分类、多标签分类、南海证据性数据
G254.1;TP391;D823
国家社会科学基金;南京工程学院校级科研基金创新基金面上项目;江苏省社会科学基金青年项目
2022-06-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
102-108