FaceNet

这是 FaceNet 的Keras实现 FaceNet: A Unified Embedding for Face Recognition and Clustering.

与 FaceNet 主要差别：

输入图片尺寸 139 -> 224。
训练数据集 CelebA -> VGGFACE2。
标定模型 Dlib -> MTCNN.

软件兼容性

Python 3.5
Tensorflow 1.6.0
Keras 2.2.0

数据集

VGGFACE2 是一个大型的人脸数据集，有9,000多个人物身份和330多万张人脸图像。

按照说明下载 VGGFACE2 数据集 vggface2_train.tar.gz 和 vggface2_test.tar.gz 放入 data 目录。

模型结构

工作流程

处理单个输入图像的工作流程如下：

人脸检测：使用 Dlib 中预先训练的模型检测面部。
人脸校准：使用 Dlib 的实时姿势估计与 OpenCV 的仿射变换来尝试使眼睛和下唇在每个图像上出现在相同位置。
卷积网络：使用深度神经网络把人脸图片映射为 128 维单位超球面上的一个点。

图片来源

性能评估

使用 Labeled Faces in the Wild (LFW) 数据集做性能评估:

13233 人脸图片
5749 人物身份
1680 人有两张以上照片

准备数据

下载 LFW database 放在 data 目录下:

$ wget http://vis-www.cs.umass.edu/lfw/lfw-funneled.tgz
$ tar -xvf lfw-funneled.tgz
$ wget http://vis-www.cs.umass.edu/lfw/pairs.txt
$ wget http://vis-www.cs.umass.edu/lfw/people.txt

评估脚本

$ python lfw_eval.py

测得结果

准确度: 89.27 %.

如何使用

数据预处理

提取训练图像:

$ python pre-process.py

执行下面命令标定人脸：
```bash
$ python align/align_dataset_mtcnn.py data/train data/train_aligned --image_size 200 --margin 24
$ python align/align_dataset_mtcnn.py data/test data/test_aligned --image_size 200 --margin 24

训练

$ python train.py

要想可视化训练过程，执行下面命令：

$ tensorboard --logdir path_to_current_dir/logs

DEMO

$ python demo.py

正(P)	欧式距离	锚(A)	欧式距离	反(N)
	0.3579		0.9037
1.2757	---	1.0052	---	1.0740
	0.7775		0.7634
1.7359	---	1.3784	---	0.7606
	0.3556		1.3154
1.1428	---	0.9498	---	0.7804
	0.5836		1.8520
2.0298	---	1.9031	---	1.9189
	0.3343		1.7794
1.3242	---	1.5383	---	0.6461
	0.2490		1.0756
1.2015	---	1.4692	---	0.8207
	0.3323		0.9058
1.1681	---	1.1821	---	0.5887
	0.6769		0.8985
1.1974	---	0.7921	---	1.3920
	0.3638		1.4623
0.8634	---	0.8968	---	0.5992
	0.3681		1.3735