10.16508/j.cnki.11-5866/n.2019.02.007
语法分析与纠错相结合的文档结构重构方法
对于传统方法在处理结构不规范的流式文档时的不足,提出一种左角分析和纠错规则相结合的新的流式文档结构重构方法.使用XML Schema构造文档逻辑构件的排版规则语法树;在排版规则语法树引导下,利用左角分析方法分析文档的逻辑构件,实现文档结构的重构;结合纠错规则对文档中的错误进行判断和改正,保证文档结构重构过程的顺利进行,得到最佳的流式文档结构.实验结果表明,所提方法在流式文档结构重构过程中的容错能力和识别准确率均优于其它算法.
流式文档、结构重构、容错处理、左角分析方法、纠错规则
34
TP302(计算技术、计算机技术)
国家自然科学基金资助项目61672105;国家高科技研究发展计划863计划2015AA015403;国家重点研发计划项目2018YFB1004100
2019-06-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
29-34