header-img: “img/post-bg-12.jpg”
Deep Perceptual Mapping for Thermal to Visible Face Recognition
Authors: Sarfraz M. Saquib, Stiefelhagen Rainer
1. Introduction
-
反射(这种人脸与可见光的多模型人脸识别已经比较成熟)
-
NIR
-
SWIR
-
-
自发
-
MWIR
-
LWIR
-
2. Related Work ( important! )
1, 3, 7, 8, 10, 12, 18, 21
facial feature detection in thermal images: 15
3. Deep Perceptual Mapping (DPM)
使用多层的全连接网络来拟合从热红外转到可见光的函数。
3.1 The DPM Model
$N+1$层的网络,第$k$层有$m^{(k)}$个单元。
两层之间:
倒数第二层:
最后一层:
目标函数:
第一项是平方误差,第二项是约束项。其中,$t_i$是训练数据中的红外图像。$x_i$是神经网络输出。
激活函数$g(x)$使用tanh,实际效果比ReLU和sigmoid好。
3.2 Thermal-Visible Face Matching
将经神经网络转化后的可见光图像的像素排成一个向量,同样将图库中拍摄的每张红外图像排列成一个向量。并将这些向量进行$L2$规范化。
然后将转化的向量与拍摄的向量进行逐一对比。
Cosine similarity:
同时进行比对:
4. Experimental Results
Dataset:UND Collection X1
-
visible images:1600×1200
-
LWIR thermal image: 312×239
此数据库包含82个人的4584张照片,包含了不同的表情和光照环境。热红外与可见光一一对应。
文中按照以往使用此数据库的做法,将一半的人(A)用于训练,另一半(B)测试。在测试时使用所有人(A+B)的红外照片。
所有的图片通过给出的眼睛和嘴巴坐标对齐。为裁剪110×150大小。
Implementation Details
-
用median filtering去除红外照片中的dead pixels
-
zero-mean normalization
-
用Difference of Gaussian(DoG) filtering强化线条,消除光照的影响。
-
对图像有重叠的块提取SIFT或者HOG特征,得到一个向量。
-
PCA降维到64维。
-
在降维后的特征向量加入该块的位置信息$(x, y)$。因此输入为66维。
4.2 Results
Thermal-Visible:55.36%
Thermal-Thermal:89.7%