wjs2108 / imageRetrieval

Image retrieval learning record

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Image Retrieval

在构建图像特征库的时候,通常不会使用原始的图像特征,这是由于Raw Feature有很多冗余信息,而且维度过高在构建特征数据库和匹配的时候效率较低。所以,通常要对提取到的原始特征进行重新编码。比较常用的三种编码方式:

  • BoF , Bog of Feature 源于文本处理的词袋模型(Bog,Bag of Words)
  • VLAD , Vector of Aggragate Locally Descriptor
  • FV , fisher vector

特征提取

  • vlfeat sift 特征提取
  • PCA降维
  • kmeans聚类

编码方式

  • BoF
  • VLAD
  • FV

源码结构说明

  • DBow3 开源的词袋模型库
    • src 源代码
    • test 简单的使用DBow3的测试代码
  • vlfeat 轻量级的视觉库
  • src 图像检索的源代码

version 0.1

上面一些基础的东西已经陆续实现了,接下来使用OpenCV实现一个简单的图像检索应用,包括:

  • Vocabulary的创建、保存、加载
  • 图像数据库的创建、保存、加载
  • 图像的vlad表示
  • 检索,返回类似的图片

这里只使用的VLAD表示图像,而没有测试BoW的原因是,电脑不行,BoW需要的Vocabulary的尺寸太大,训练时间太长。

About

Image retrieval learning record


Languages

Language:C 83.4%Language:C++ 13.4%Language:Objective-C 2.1%Language:Roff 0.8%Language:CMake 0.2%