图像识别之颜色直方图特征可行性分析
几天前连续写了两篇博客,对如何使用OpenCV来使用直方图特征对图像的相似性进行检测进行了说明,分别为OpenCV之灰度直方图反向投影(图像相似性检测)和OpenCV之彩色直方图反向投影(图像相似性检测),下面就来讨论一下将其应用于图像识别的可行性,首先我们来看一下直方图的物理含义,直方图实际上描述的是图像灰度值的概率分布,其中颜色可以看成是不同通道的灰度值的联合概率分布,也可以直观的说成人眼所感知的颜色的分布,类似于图像中红色占30%之类的描述,直方图实际上就是种统计特征,那么利用这种统计特征就可能会出现这样一种情况,即可能出现图像内容完全没有相似性的图像具有相同的统计特征,那么利用直方图就会出现识别错误的情况。
对于图像识别所用的特征而言,有四个重要的性能指标,分别为尺度不变性、旋转不变性、光照不变性和实时性,首先来看尺度不变性,我的理解就是相当于对原始图像进行一定的缩放,再提取特征与原始图像进行比较,相当于对原始图像进行插值或者降采样,这其中会造成一定信息的损失/增加,从而导致直方图出现变化,会对识别造成移动的影响,从而导致识别出现错误;接下来看旋转不变性,很明显图像的旋转不会对直方图特征产生影响;再看光照不变性质,这是一个比较重要的问题,尤其是对户外环境的识别场景,我先举个例子,对于光面的图书封皮而言,当有光达到其上面时,人们往往无法分别出其本来颜色, 会导致人们对其认知出现问题,低照度的情况实际上也是一致的,这也就说明了直方图特征对光照很敏感,当光照或很弱时导致其统计特征出错,导致识别出错;最后来看实时性,这是一个对算法的时间复杂度评价的一个指标,由于直方图特征只需要对图像遍历一次就可以获得,计算耗时较少。总结一下,就是直方图特征具有旋转不变性和实时性,不具有尺度不变性和光照不变性。
上面主要对颜色直方图特征的一些特性进行了说明,可以看出单纯的利用该特征无法获得准确的识别结果,只能作为一个初步的过滤,然后再利用一些高级特征来进行识别,如鲁棒性较好的SIFT和SURF特征。
以上只是我的个人见解,欢迎各位技术牛人多提建议,不吝赐教。