10.16811/j.cnki.1001-4314.2018.03.027
网刊元数据自动提取和PDF文件自动分割实践——以“中西医结合护理”网站为例
以《中西医结合护理》排版所用的方正书版文件为例,介绍用于圈定元数据字段的“准标签对”的选择技巧,以及fbd文件与html文件之间的字符兼容性和格式对等性的处理方法.以此为基础,可以方便地实现高质量网刊元数据的高效率自动提取,以及PDF文件的精准自动分割与转页合并.实践证明,对于特定期刊而言,上述工作是很容易自主完成的.
网刊、元数据、自动提取、PDF文件、自动分割—合并
30
2018-08-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
302-304