DOI：10.3969/j.issn.1007-7162.2015.04.027

基于视觉字典容量自动获取的LDA场景分类研究

引用

摘要：

提出了一种高效获取词包模型中视觉字典容量的方法,并研究了该方法与隐狄利克雷分配模型( Latent Dirichlet Allocation,LDA )相结合情况下的场景分类性能.在用SIFT特征构建场景图像数据集特征矩阵的基础上,首先采用吸引子传播方法获取场景图像集特征矩阵的合理聚类数目族,并将其中的最小聚类数目作为视觉字典容量,进而生成视觉字典;然后利用所构建视觉字典中的单词描述场景图像训练集和测试集;最后采用LDA模型对场景图像测试集进行场景分类实验.实验结果表明,提出的方法不仅保持了较高场景分类准确率,同时显著提高了场景分类的效率.

关键词：词包模型、视觉单词、视觉字典、隐狄利克雷分配模型

所属期刊栏目：32

分类号：TP311.11(计算技术、计算机技术)

资助基金：广东省科技计划项目2010A030500006

在线出版日期：2015-12-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：150-154

英文信息展示

期刊专题