DOI：10.3969/j.issn.1003-6059.2013.10.002

基于多视觉码本的图像表示

引用

摘要：

基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差。文中提出一种基于多视觉码本的图像表示方法，通过综合考虑码本构建和编码方法这两个方面的因素加以改进。具体包括：1)多视觉码本构建，以迭代方式构建多个紧凑且具有互补性的视觉码本；2)图像表示，首先针对多码本的情况，依次从各码本中选择相应的视觉单词并采用线性回归估计编码系数，然后结合图像的空间金字塔结构形成最终的图像表示。在一些标准测试集合的图像分类结果验证文中方法的有效性。

关键词：图像分类、视觉码本、聚类分析、图像表示

分类号：TN912.34

资助基金：国家自然科学基金资助项目61172158

在线出版日期：2013-11-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：909-915

英文信息展示

期刊专题