局部二值模式(Local Binary Patter, LBP)是一种用来描述图像局部纹理特征的算子,LBP特征具有灰度不变性和旋转不变性等显著优点,它将图像中的各个像素与其邻域像素值进行比较,将结果保存为二进制数,并将得到的二进制比特串作为中心像素的编码值,也就是LBP特征值。LBP提供了一种衡量像素间邻域关系的特征模式,因此可以有效地提取图像的局部特征,而且由于其计算简单,可用于基于纹理分类的实时应用场景,例如目标检测、人脸识别等。
原始LBP特征
原始的LBP算子定义于图像中$3 \times 3$的邻域窗口,取窗口内中心像素的灰度值作为阈值,将8邻域像素的灰度值与其进行比较,若邻域像素值大于中心像素值,则比较结果取值为1,否则为0。这样邻域内的8个像素点经过比较后可得到8位二进制数,将其按顺序依次排列即可得到中心像素的LBP值。LBP特征值反映了中心像素和其邻域的纹理信息。LBP的取值一共有$2^8 = 256$种,和一幅普通的灰度图像类似,因此可将LBP特征以灰度图的形式表达出来。由于LBP特征考虑的是纹理信息,而不包含颜色信息,因此彩色图需转换为灰度图。原始LBP特征的提取过程如下图所示:
公式定义如下:
$$LBP(x_c,y_c)=\Sigma_{p=0}^{P-1} 2^p s(i_p-i_c)$$
其中$(x_c,y_c)$代表邻域窗口内的中心像素,其像素值为$i_c$,$i_p为邻域内其他像素值$,s(x)是符号函数。
原始LBP特征的实现代码(OpenCV)如下:
圆形LBP特征(Circular LBP or Extended LBP)
原始LBP特征考虑的是固定半径范围内的邻域像素,不能满足不同尺寸和频率纹理的需求,当图像的尺寸发生变化时,LBP特征将不能正确编码局部邻域的纹理信息。为了适应不同尺寸的纹理特征,Ojala等人对LBP算子
进行了改进,将$3 \times 3$邻域窗口扩展到任意邻域,并用圆形邻域代替了正方形邻域,改进后的LBP算子允许在半径为R的邻域内有任意多个像素点,从而得到在半径为R的区域内含有P个采样点的LBP算子。
采样点的坐标可通过以下公式计算:
$$x_p=x_c+R cos(2\pi p / P)$$
$$y_p=y_c+R sin(2\pi p / P)$$
其中$(x_c,y_c)$为中心像素点,$(x_p,y_p),p\in P$为邻域内某个采样点,通过上次可以计算任意个采样点的坐标,但是得到的坐标值未必为整数,因此可通过双线性插值的方法来得到该采样点的像素值:
$$f(x, y) = \left[ \begin{matrix} 1-x& x\end{matrix} \right] \left[ \begin{matrix} f(0,0)& f(0,1)\\ f(1,0)& f(1,1)\end{matrix} \right] \left[ \begin{matrix} 1-y\\ y\end{matrix} \right]$$
圆形LBP特征的实现代码如下:
圆形LBP特征的效率优化版本:
旋转不变LBP特征(Rotation Invariant LBP)
无论是原始LBP算子还是圆形LBP算子,都只是灰度不变的,而不是旋转不变的,旋转图像会得到不同的LBP特征值。相关研究人员又提出了一种具有旋转不变性的LBP算子,即不断旋转圆形邻域的采样点,或者以不同的邻域像素作为起始点,顺时针遍历所有采样点,得到一系列编码值(P个),取其中最小的作为该邻域中心像素的LBP值。旋转不变LBP算子的示意图如下:
旋转不变LBP特征的实现代码如下:
LBP等价模式(Uniform LBP)
对于一个半径为R的圆形区域,包含有P个邻域采样点,则LBP算子可能产生$2^P$种模式。随着邻域内采样点数的增加,LBP值的取值数量呈指数级增长。例如$5 \times 5$邻域内20个采样点,则对应有$2^{20}$中模式,过多的二进制模式不利于纹理信息的提取、分类、识别。例如,将LBP特征用于纹理分类或人脸识别时,一般采用LBP特征的统计直方图来表达图像的信息,而较多的模式种类将使得数据量过大,且直方图过于稀疏。因此,需要对原始的LBP特征进行降维,使得数据量减少的情况下能最好地表达图像的信息。
为了解决二进制模式过多的问题,提高统计性,Ojala提出了一种“等价模式”(Uniform Pattern)来对LBP特征的模式种类进行降维。Ojala认为,在实际图像中,绝大数LBP模式最多只包含两次从0到1或者从1到0的跳变,“等价模式”定义为:当某个LBP所对应的循环二进制数从0到1或者从1到0最多有两次跳变时,该LBP所对应的二进制就是一个等价模式类。如00000000(0次跳变),11000011(2次跳变)都是等价模式类。除等价模式类以外的模式都归为另一类,称为混合模式类,例如10010111(共4次跳变)。通过改进,二进制模式的种类大大减少,由原来的$2^P$中降为$P(P-1)+2+1$种,其中$P(P-1)$为2次跳变的模式数,2为0次跳变(全”0”或全”1”)的模式数,1为混合模式的数量,由于是循环二进制数,因此’0’、’1’跳变次数不可能为奇数次。对于$3 \times 3$邻域内8个采样点来说,二进制模式由原始的256种变为59种。这使得特征向量的维数大大减少,并且可以减少高频噪声带来的影响。实验表明,一般情况下,等价模式的数目占全部模式的90%以上,可以有效对数据进行降维。下图为58种等价模式类:
在具体实现中,等价模式类按值递增从1开始编码,混合模式类编码为0,因此得到的LBP特征图整体偏暗。LBP等价模式的实现代码如下:
此外,旋转不变的Uniform LBP算子的等价模式类的数目为P+1个,对于8个采样点,基于等价模式的旋转不变LBP模式只有9个输出,该模式对于上图的Uniform LBP,每一行都是旋转不变的,对应同一个编码值。
多尺度LBP(Multiscale Block LBP)
基本LBP算子获取的是单个像素和其邻域像素间的纹理信息,属于微观特征。中科院的研究人员针对此提出了一种多尺度的LBP算子,将图像分为一个个块(block),再将每个块分为一个个的小连通区域(cell),类似于HOG特征,cell内的灰度平均值或者和值作为当前cell的灰度阈值,与邻域cell进行比较得到LBP值,生成的特征即为MB-LBP,block大小为$3 \times 3$,cell大小为1,就是原始的LBP特征。下图所示block为$9 \times 9$,cell为$3 \times 3$。
MB-LBP特征的实现代码如下:
多尺度模式下同样用到了降维,论文中是直接采样统计的方法对不同尺度的LBP算子的模式进行统计,选取占比例较高的模式,而不是利用跳变规则。具体来说,就是将得到的MB-LBP特征计算统计直方图,通过对bin中的数值进行排序以及权衡,将排序在前N(63)位的特征值看作是等价模式类,其余的为混合模式类,总共为N+1类,论文中称之为(SEMB-LBP, Statistically Effective MB-LBP)。
SEMB-LBP的实现代码如下:
图像的LBP特征向量(Local Binary Patterns Histograms)
对图像中的每个像素求取LBP特征值可得到图像的LBP特征图谱,但一般不直接将LBP图谱作为特征向量用于分类识别,而是类似于HOG特征,采用LBP特征的统计直方图作为特征向量。将LBP特征图谱划分为若干个子连通区域,并提取每个局部块的直方图,然后将这些直方图一次连接在一起形成LBP特征的统计直方图(LBPH),即可用于分类识别的LBP特征向量。
LBP特征向量的具体计算过程如下:
- 按照上述算法计算图像的LBP特征图谱
- 将LBP特征图谱分块,例如分成$8 \times 8 = 64$个区域
- 计算每个子区域中LBP特征值的统计直方图,并进行归一化,直方图大小为$1 \times numPatterns$
- 将所有区域的统计直方图按空间顺序依次连接,得到整幅图像的LBP特征向量,大小为$1 \times (numPatterns \times 64)$
- 从足够数量的样本中提取LBP特征,并利用机器学习的方法进行训练得到模型,用于分类和识别等领域。
对于LBP特征向量的维度,邻域采样点为8个,如果是原始的LBP特征,其模式数量为256,特征维数为$64 \times 256 = 16384$;如果是Uniform LBP特征,其模式数量为59,特征维数为$64 \times 59 = 3776$,使用等价模式特征,可以有效进行数据降维,而对模型性能却无较大影响。
LBP特征向量的实现代码如下:
除了以上几种比较经典的LBP特征外,还有诸多变种,如TLBP(中心像素与周围所有像素比较,而不是根据采样点的数目),DLBP(编码4邻域的灰度变化,每个方向上用两个比特编码),MLBP(将中心像素值替换为采样点像素的平均值),VLBP,RGB-LBP等。
LBP特征的应用
目标检测
人脸检测中比较典型的模型是Haar特征 + AdaBoost分类器,目前OpenCV也支持LBP + AdaBoost和HOG + AdaBoost的方法进行目标检测,而且LBP特征的训练速度较快,适用于实时检测场景。
人脸识别
人脸识别中LBP特征向量主要是用于直方图的比较,通过距离度量的方式(例如方差)找到训练数据中与输入图像距离最小的特征向量,将其对应的类别作为识别结果输出。
reference
- Paper: Gray Scale and Rotation Invariant Texture Classification with Local Binary Patterns
- Paper: Multiresolution Gray Scale and Rotation Invariant Texture Classification with Local Binary Patterns
- Paper: Face Recognition with Local Binary Patterns
- Paper: Learning Multi-scale Block Local Binary Patterns for Face Recognition
- http://www.voidcn.com/blog/quincuntial/article/p-4988349.html
- http://blog.csdn.net/zouxy09/article/details/7929531
- http://blog.jasonding.top/2014/11/04/Machine%20Learning/%E3%80%90%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89%E3%80%91LBP%E7%BA%B9%E7%90%86%E7%89%B9%E5%BE%81/
- http://blog.csdn.net/liulina603/article/details/8291105