tensorflow比caffe入门要难许多,但是感觉比caffe可操作性强。这份代码是为了以后训练网络不要重复进行tensorflow多GPU并行、数据增强(翻转、旋转、裁剪等)等操作而写的。
我阅读了tf的官网关于多GPU实现的部分,以及facenet中多线程读取数据+预处理(数据增强、shuffle)的部分,还有一个实现多GPU的VGG的github。
数据流水线似乎还不是太好,很难有多块GPU长时间维持在80%~100%的利用率。
1、align文件夹——dlib 68 点人脸检测+对齐(对齐可选)
2、experiment.yaml——类似于caffe的solver配置文件
3、layers.py——定义一些tensor
4、tools.py——加载.npz/.npy文件(把caffe model转到tf时会用到)
5、train_data_generator.py(流水线读取数据)
6、train_model_parallel.py(主文件)
7、vgg.py
最近在实现VGG face的triplet loss,所以才从caffe转向tf,等复现了论文再来更新一波。