10.16208/j.issn1000-7024.2016.05.024
基于有向图的流式文档逻辑结构重构方法
为解决以往流式文档中逻辑结构重构方法的不足,提出一种基于有向图的流式文档逻辑结构重构方法。从模板文档中提取逻辑结构,在此基础上,通过对待查文档中的逻辑标签进行筛选建立有向图,利用有向图的单源最短路径算法过滤多余的逻辑结构,得到最佳的文档逻辑结构。实验结果表明,该算法能够有效改善逻辑结构识别的准确性,对于文档内容理解和自动化排版与格式检查等应用具有重要意义。
逻辑结构重构、逻辑标签、自动排版格式检查、流式文档、单源最短路径
37
TP302(计算技术、计算机技术)
北京市属高等学校创新团队建设与教师职业发展计划基金项目IDHT20130519;数字出版技术国家重点实验室开放课题基金项目BX9161123405
2016-07-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
1239-1244