用tensorlayer导入Slim模型迁移学习

　　上一篇博客【用tensorflow迁移学习猫狗分类】笔者讲到用tensorlayer的【VGG16模型】迁移学习图像分类，那麽问题来了，tensorlayer没提供的模型怎么办呢？别担心，tensorlayer提供了tensorflow中的【slim模型】导入功能，代码例子在tutorial_inceptionV3_tfslim。
　　那么什么是slim？slim到底有什么用？
slim是一个使构建，训练，评估神经网络变得简单的库。它可以消除原生tensorflow里面很多重复的模板性的代码，让代码更紧凑，更具备可读性。另外slim提供了很多计算机视觉方面的著名模型（VGG, AlexNet等），我们不仅可以直接使用，甚至能以各种方式进行扩展。（笔者注：总之功能跟tensorlayer差不多嘛）更多介绍可以看这篇文章：【Tensorflow】辅助工具篇——tensorflow slim(TF-Slim)介绍】
　　要进行迁移学习，首先需要slim模型代码以及预训练好的权重参数，这些谷歌都有提供下载，可以看到主页下面有各个模型以及在imagenet训练集下的参数地址。
用tensorlayer导入Slim模型迁移学习
列表还列出了各个模型的top1、top5的正确率，模型很多了。
　　好了我们下载Inception-ResNet-v2以及inception_resnet_v2_2016_08_30.tar.gz，py文件和解压出来的.ckpt文件放到项目根目录下面。至于为什么不用tensorlayer例子提供的Inception V3？因为Inception-ResNet-v2正确率高啊。（哈哈真正原因最后来讲）。
　　我们依旧进行猫狗分类，按照教程导入模型修改num_classes再导入训练数据，直接训练是会报错的，因为最后的Logits层几个参数在恢复时维度不匹配。
最后几个参数是不能恢复了，笔者也没有找到选择性恢复.ckpt参数的tensorflow方法。怎么办呢？幸好群里面有位朋友提供了一个方法，参见【Tensorflow 迁移学习】：
用tensorlayer导入Slim模型迁移学习
主要思想是：先把所有.ckpt参数恢复成npz格式，再选择恢复npz中的参数，恢复npz中的参数就跟前一篇博客操作一样的了。
所以整个过程分两步走：
1.将参数恢复然后保存为npz格式：
　　下面是具体代码：

import os

import time

from recordutil import *

import numpy as np

# from tensorflow.contrib.slim.python.slim.nets.resnet_v2 import resnet_v2_152

# from tensorflow.contrib.slim.python.slim.nets.vgg import vgg_16

import skimage

import skimage.io

import skimage.transform

import tensorflow as tf

from tensorlayer.layers import *

# from scipy.misc import imread, imresize

# from tensorflow.contrib.slim.python.slim.nets.alexnet import alexnet_v2

from inception_resnet_v2 import (inception_resnet_v2_arg_scope, inception_resnet_v2)

from scipy.misc import imread, imresize

from tensorflow.python.ops import variables

import tensorlayer as tl

slim = tf.contrib.slim

try:

from data.imagenet_classes import *

except Exception as e:

raise Exception(

"{} / download the file from: https://github.com/zsdonghao/tensorlayer/tree/master/example/data".format(e))

n_epoch = 200

learning_rate = 0.0001

print_freq = 2

batch_size = 32

## InceptionV3 / All TF-Slim nets can be merged into TensorLayer

x = tf.placeholder(tf.float32, shape=[None, 299, 299, 3])

# 输出

y_ = tf.placeholder(tf.int32, shape=[None, ], name='y_')

net_in = tl.layers.InputLayer(x, name='input_layer')

with slim.arg_scope(inception_resnet_v2_arg_scope()):

network = tl.layers.SlimNetsLayer(

prev_layer=net_in,

slim_layer=inception_resnet_v2,

slim_args={

'num_classes': 1001,

'is_training': True,

},

name='InceptionResnetV2' # <-- the name should be the same with the ckpt model

)

# network = fc_layers(net_cnn)

sess = tf.InteractiveSession()

network.print_params(False)

# network.print_layers()

saver = tf.train.Saver()

# 加载预训练的参数

# tl.files.assign_params(sess, npz, network)

tl.layers.initialize_global_variables(sess)

saver.restore(sess, "inception_resnet_v2.ckpt")

print("Model Restored")

all_params = sess.run(network.all_params)

np.savez('inception_resnet_v2.npz', params=all_params)

sess.close()

　　执行成功之后，我们得到模型所有的908个参数。
2.部分恢复npz参数然后训练模型：
　　首先我们修改模型最后一层参数，由于进行的是2分类学习，所以做如下修改：

with slim.arg_scope(inception_resnet_v2_arg_scope()):

network = tl.layers.SlimNetsLayer(

prev_layer=net_in,

slim_layer=inception_resnet_v2,

slim_args={

'num_classes': 2,

'is_training': True,

},

name='InceptionResnetV2' # <-- the name should be the same with the ckpt model

)

　　num_classes改为2，is_training为True。
　　接着定义输入输出以及损失函数：

sess = tf.InteractiveSession()

# saver = tf.train.Saver()

y = network.outputs

y_op = tf.argmax(tf.nn.softmax(y), 1)

cost = tl.cost.cross_entropy(y, y_, name='cost')

correct_prediction = tf.equal(tf.cast(tf.argmax(y, 1), tf.float32), tf.cast(y_, tf.float32))

acc = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

　　下面是定义训练参数，我们只训练最后一层的参数，打印参数出来我们看到：

[TL] param 900: InceptionResnetV2/AuxLogits/Conv2d_2a_5x5/weights:0 (5, 5, 128, 768) float32_ref

[TL] param 901: InceptionResnetV2/AuxLogits/Conv2d_2a_5x5/BatchNorm/beta:0 (768,) float32_ref

[TL] param 902: InceptionResnetV2/AuxLogits/Conv2d_2a_5x5/BatchNorm/moving_mean:0 (768,) float32_ref

[TL] param 903: InceptionResnetV2/AuxLogits/Conv2d_2a_5x5/BatchNorm/moving_variance:0 (768,) float32_ref

[TL] param 904: InceptionResnetV2/AuxLogits/Logits/weights:0 (768, 2) float32_ref

[TL] param 905: InceptionResnetV2/AuxLogits/Logits/biases:0 (2,) float32_ref

[TL] param 906: InceptionResnetV2/Logits/Logits/weights:0 (1536, 2) float32_ref

[TL] param 907: InceptionResnetV2/Logits/Logits/biases:0 (2,) float32_ref

[TL] num of params: 56940900

　　从param 904开始训练就行了，参数恢复到param 903
　　下面是训练函数以及恢复部分参数，加载样本数据：

# 定义 optimizer

train_params = network.all_params[904:]

print('训练参数:', train_params)

# # 加载预训练的参数

# tl.files.assign_params(sess, params, network)

train_op = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost, var_list=train_params)

img, label = read_and_decode("D:\\001-Python\\train299.tfrecords")

# 使用shuffle_batch可以随机打乱输入

X_train, y_train = tf.train.shuffle_batch([img, label],

batch_size=batch_size, capacity=200,

min_after_dequeue=100)

tl.layers.initialize_global_variables(sess)

params = tl.files.load_npz('', 'inception_resnet_v2.npz')

params = params[0:904]

print('当前参数大小：', len(params))

tl.files.assign_params(sess, params=params, network=network)

　　下面依旧是训练模型的代码，跟上一篇一样：

# # 训练模型

coord = tf.train.Coordinator()

threads = tf.train.start_queue_runners(sess=sess, coord=coord)

step = 0

filelist = getfilelist()

for epoch in range(n_epoch):

start_time = time.time()

val, l = sess.run([X_train, y_train])#next_data(filelist, batch_size) #

for X_train_a, y_train_a in tl.iterate.minibatches(val, l, batch_size, shuffle=True):

sess.run(train_op, feed_dict={x: X_train_a, y_: y_train_a})

if epoch + 1 == 1 or (epoch + 1) % print_freq == 0:

print("Epoch %d of %d took %fs" % (epoch + 1, n_epoch, time.time() - start_time))

train_loss, train_acc, n_batch = 0, 0, 0

for X_train_a, y_train_a in tl.iterate.minibatches(val, l, batch_size, shuffle=True):

err, ac = sess.run([cost, acc], feed_dict={x: X_train_a, y_: y_train_a})

train_loss += err

train_acc += ac

n_batch += 1

print(" train loss: %f" % (train_loss / n_batch))

print(" train acc: %f" % (train_acc / n_batch))

# tl.files.save_npz(network.all_params, name='model_vgg_16_2.npz', sess=sess)

coord.request_stop()

coord.join(threads)

　　batchsize为20训练200代，部分结果如下：

Epoch 156 of 200 took 12.568609s

train loss: 0.382517

train acc: 0.950000

Epoch 158 of 200 took 12.457161s

train loss: 0.382509

train acc: 0.850000

Epoch 160 of 200 took 12.385407s

train loss: 0.320393

train acc: 1.000000

Epoch 162 of 200 took 12.489218s

train loss: 0.480686

train acc: 0.700000

Epoch 164 of 200 took 12.388841s

train loss: 0.329189

train acc: 0.850000

Epoch 166 of 200 took 12.446472s

train loss: 0.379127

train acc: 0.900000

Epoch 168 of 200 took 12.888571s

train loss: 0.365938

train acc: 0.900000

Epoch 170 of 200 took 12.850605s

train loss: 0.353434

train acc: 0.850000

Epoch 172 of 200 took 12.855129s

train loss: 0.315443

train acc: 0.950000

Epoch 174 of 200 took 12.906666s

train loss: 0.460817

train acc: 0.750000

Epoch 176 of 200 took 12.830738s

train loss: 0.421025

train acc: 0.900000

Epoch 178 of 200 took 12.852572s

train loss: 0.418784

train acc: 0.800000

Epoch 180 of 200 took 12.951322s

train loss: 0.316057

train acc: 0.950000

Epoch 182 of 200 took 12.866213s

train loss: 0.363328

train acc: 0.900000

Epoch 184 of 200 took 13.012520s

train loss: 0.379462

train acc: 0.850000

Epoch 186 of 200 took 12.934583s

train loss: 0.472857

train acc: 0.750000

Epoch 188 of 200 took 13.038168s

train loss: 0.236005

train acc: 1.000000

Epoch 190 of 200 took 13.056378s

train loss: 0.266042

train acc: 0.950000

Epoch 192 of 200 took 13.016137s

train loss: 0.255430

train acc: 0.950000

Epoch 194 of 200 took 13.013147s

train loss: 0.422342

train acc: 0.900000

Epoch 196 of 200 took 12.980659s

train loss: 0.353984

train acc: 0.900000

Epoch 198 of 200 took 13.033676s

train loss: 0.320018

train acc: 0.950000

Epoch 200 of 200 took 12.945982s

train loss: 0.288049

train acc: 0.950000

　　好了，迁移学习Inception-ResNet-v2结束。
　　作者说SlimNetsLayer是能导入任何Slim Model的。笔者已经验证过导入Inception-ResNet-v2和VGG16成功，Inception V3导入后训练了两三天，正确率一直在10到70之间波动（跟笔者的心情一样不稳定），笔者一直找不出原因，心累，希望哪位朋友再去验证一下Inception V3咯。

用tensorlayer导入Slim模型迁移学习的更多相关文章

第二十四节，TensorFlow下slim库函数的使用以及使用VGG网络进行预训练、迁移学习(附代码)
在介绍这一节之前,需要你对slim模型库有一些基本了解,具体可以参考第二十二节,TensorFlow中的图片分类模型库slim的使用.数据集处理,这一节我们会详细介绍slim模型库下面的一些函数的使用 ...
Gluon炼丹（Kaggle 120种狗分类，迁移学习加双模型融合）
这是在kaggle上的一个练习比赛,使用的是ImageNet数据集的子集. 注意,mxnet版本要高于0.12.1b2017112. 下载数据集. train.zip test.zip labels ...
基于深度学习和迁移学习的识花实践——利用 VGG16 的深度网络结构中的五轮卷积网络层和池化层，对每张图片得到一个 4096 维的特征向量，然后我们直接用这个特征向量替代原来的图片，再加若干层全连接的神经网络，对花朵数据集进行训练（属于模型迁移）
基于深度学习和迁移学习的识花实践(转) 深度学习是人工智能领域近年来最火热的话题之一,但是对于个人来说,以往想要玩转深度学习除了要具备高超的编程技巧,还需要有海量的数据和强劲的硬件.不过 Tens ...
1 如何使用pb文件保存和恢复模型进行迁移学习（学习Tensorflow 实战google深度学习框架）
学习过程是Tensorflow 实战google深度学习框架一书的第六章的迁移学习环节. 具体见我提出的问题:https://www.tensorflowers.cn/t/5314 参考https:/ ...
基于TensorFlow Object Detection API进行迁移学习训练自己的人脸检测模型（二）
前言已完成数据预处理工作,具体参照: 基于TensorFlow Object Detection API进行迁移学习训练自己的人脸检测模型(一) 设置配置文件新建目录face_faster_rcn ...
ML&period;NET 示例：图像分类模型训练-首选API（基于原生TensorFlow迁移学习）
ML.NET 版本 API 类型状态应用程序类型数据类型场景机器学习任务算法 Microsoft.ML 1.5.0 动态API 最新控制台应用程序和Web应用程序图片文件图像分类基 ...
PV3D学习笔记-导入DAE模型
网上关于PV3D导入DAE模型的例子都非常多,可惜我研究了半天,一个都没成功,或者是破面问题,或者是贴图不显示,再或者贴图乱掉了.今天晚上终于搞定,心得发上来. 制作模型的软件是SketchUp ...
【深度学习系列】迁移学习Transfer Learning
在前面的文章中,我们通常是拿到一个任务,譬如图像分类.识别等,搜集好数据后就开始直接用模型进行训练,但是现实情况中,由于设备的局限性.时间的紧迫性等导致我们无法从头开始训练,迭代一两百万次来收敛模型, ...
用tensorflow迁移学习猫狗分类
笔者这几天在跟着莫烦学习TensorFlow,正好到迁移学习(至于什么是迁移学习,看这篇),莫烦老师做的是预测猫和老虎尺寸大小的学习.作为一个有为的学生,笔者当然不能再预测猫啊狗啊的大小啦,正好之前正 ...

随机推荐

Ajax语法浅析
Ajax是目前很普遍的一门技术,也是很值得探讨和研究的一门技术.本文将针对Ajax的发展过程并结合其在不同库框架中的使用方式来和大家分享下Ajax的那些新老语法. Ajax简介 Ajax全称为“Asy ...
精选9个值得学习的 HTML5 效果【附源码】
这里精选了一组很酷的 HTML5 效果.HTML5 是现 Web 开发领域的热点, 拥有很多让人期待已久的新特性,特别是在移动端,Web 开发人员可以借助 HTML5 强大功能轻松制作各种交互性强.效 ...
Jade之Extends
Extends jade允许多个jade文件继承一个jade文件. jade: //- layout.jade doctype html html head block title title Def ...
Cesium的api之关于viewer
1.viewer是用来构建三维的主要的部件:通过创建viewer可以完成三维的图片.地形的展示等 2.属性 * @param {Element|String} container :指定的是在html ...
Everything You Wanted to Know About Machine Learning
Everything You Wanted to Know About Machine Learning 翻译了理解机器学习的10个重要的观点,增加了自己的理解.这些原则在大部分情况下或许是这样,可是 ...
【*好问题】将InputStream转换为String
不重复造*. 最可靠的方法,或者使用Apache commons IOUtils 这样简单几行代码就搞定了 StringWriter writer = new StringWriter(); IO ...
mac 显示隐藏文件方法
终端执行命令: 显示:#defaults write com.apple.finder AppleShowAllFiles -bool true隐藏:#defaults write com.apple ...
微信小程序怎么做出前端table的效果
wxml代码: <view class="container"> <view class="table"> &l ...
初识mysql学习笔记
使用VMVirtualBox导入Ubuntu后,可以通过sudo apt-get install mysql-server命令下载mysql. 在学习过程中,我遇到了连接不上Xshell的问题.最终在 ...
passwd命令使用
2018-03-01 10:01:06 例1:passwd username 直接修改用户的密码普通用户可以且只能修改自己的密码,root用户可以修改任何人的密码[root@localhost ~] ...