开放集文字识别技术
开放环境下的模式识别与文字识别应用中,新数据、新模式和新类别不断涌现,要求算法具备应对新类别模式的能力.针对这一问题,研究者们开始聚焦开放集文字识别(open-set text recognition,OSTR)任务.该任务要求,算法在测试(推断)阶段,既能识别训练集见过的文字类别,还能够识别、拒识或发现训练集未见过的新文字.开放集文字识别逐步成为文字识别领域的研究热点之一.本文首先对开放集模式识别技术进行简要总结,然后重点介绍开放集文字识别的研究背景、任务定义、基本概念、研究重点和技术难点.同时,针对开放集文字识别三大问题(未知样本发现、新类别识别和上下文信息偏差),从方法的模型结构、特点优势和应用场景的角度对相关工作进行了综述.最后,对开放集文字识别技术的发展趋势和研究方向进行了分析展望.
文字识别、开放集模式识别、开放集文字识别(OSTR)、封闭集文字识别、零样本文字识别
28
TP391.43(计算技术、计算机技术)
2023-07-27(万方平台首次上网日期,不代表论文的发表时间)
共25页
1767-1791