keras学习笔记-bili莫烦

时间:2022-01-15 13:58:23

一、keras的backend设置

有两种方式:

1.修改JSON配置文件

  修改~/.keras/keras.json文件内容为:

{
    "iamge_dim_ordering":"tf",
    "epsilon":1e-07,
    "floatx":"float32",
    "backend":"tensorflow"
}

  官方文档解释:

  • iamge_data_format:字符串,"channels_last"或"channels_first",该选项指定了Keras将要使用的维度顺序,可通过keras.backend.image_data_format()来获取当前的维度顺序。对2D数据来说,"channels_last"假定维度顺序为(rows,cols,channels)而"channels_first"假定维度顺序为(channels, rows, cols)。对3D数据而言,"channels_last"假定(conv_dim1, conv_dim2, conv_dim3, channels),"channels_first"则是(channels, conv_dim1, conv_dim2, conv_dim3)

  • epsilon:浮点数,防止除0错误的小数字

  • floatx:字符串,"float16""float32""float64"之一,为浮点数精度
  • backend:字符串,所使用的后端,为"tensorflow"或"theano"

2.修改python环境变量中的 KERAS_BACKEND参数值

import os
os.environ["KERAS_BACKEND"]="tensorflow"

  在这种情况下,效果只是临时的,但可以总是写在代码的最前面,同样可以达到目的。

二、使用keras实现线性回归

import numpy as np
import matplotlib.pyplot as plt

# 按顺序建立的model结构
from keras.models import Sequential
# Dense是全连接层
from keras.layers import Dense

# seed给定一个种子,利用同一个种子生成的随机数每次都相同
np.random.seed(1337)

# 从-1到1生成200个均间距数
X = np.linspace(-1, 1, 200)
# 打乱数据
np.random.shuffle(X)
# 生成Y,并添加随机噪声
Y = 0.5 * X + 2 + np.random.normal(0, 0.05, (200,))
# 画散点图
plt.scatter(X, Y)
plt.show()
# XY的前160个数据作为训练数据,后40个数据作为测试数据
X_train, Y_train = X[:160], Y[:160]
X_test, Y_test = X[160:], Y[160:]

# 开始使用Keras创建网络结构
model = Sequential()
# 添加一个全连接层,该层的输入维度是1,输出维度也是1。
model.add(Dense(output_dim=1, input_dim=1))

# 设置选择的损失函数,还有优化器
model.compile(loss='mse', optimizer='sgd')

# 开始训练
print("Training ----------")
for step in range(301):
    # 每次迭代都使用全部的训练集
    cost = model.train_on_batch(X_train, Y_train)
    if step % 50 == 0:
        print("Train cost:", cost)

# 开始测试
print("Testing -----------")
cost = model.evaluate(X_test, Y_test, batch_size=40)
print("Test cost:", cost)
W, b = model.layers[0].get_weights()
print("Weights=", W, "\nBiases=", b)

# 画出在测试集上的拟合情况
Y_predict = model.predict(X_test)
# 画出测试集的散点图
plt.scatter(X_test, Y_test)
# 画出预测值对应的直线,颜色为红色
plt.plot(X_test, Y_predict, color='g')
plt.show()

keras学习笔记-bili莫烦keras学习笔记-bili莫烦

三、使用keras给mnist分类

# 解决报错GPU运行报错的问题
# 这里导入tf,用来修改tf后端的配置
import tensorflow as tf
from keras.backend.tensorflow_backend import set_session

config = tf.ConfigProto()
# 将显存容量调到只会使用30%
config.gpu_options.per_process_gpu_memory_fraction = 0.3
# 使用设置好的配置
set_session(tf.Session(config=config))

import numpy as np

np.random.seed(1337)
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
# 导入全连接层和激活函数
from keras.layers import Dense, Activation
# 导入优化器RMSprop
from keras.optimizers import RMSprop

(X_train, y_train), (X_test, y_test) = mnist.load_data()
print(X_train.shape[0])
print(X_test.shape[0])
# 将数据由原本的shape-(60000,28,28)变为(60000,784),然后将数据缩放到0-1之间
X_train = X_train.reshape(X_train.shape[0], -1) / 255
X_test = X_test.reshape(X_test.shape[0], -1) / 255
# 将标签数据变换为onehot模式,原本是用10进制数来表示的
y_train = np_utils.to_categorical(y_train)
print(y_test)
y_test = np_utils.to_categorical(y_test)
print(y_test)

# 可以在model中将各层放在一个列表中
model = Sequential([
    # 第一个全连接层,输入784,输出32
    Dense(output_dim=32, input_dim=784),
    Activation('relu'),
    # 不设置input_dim,会默认使用上一层的output_dim
    Dense(10),
    Activation('softmax'),
])
# 这样也可以
# model = Sequential()
# model.add(Dense(32,input_dim=784))
# model.add(Activation('relu'))
# model.add(Dense(10))
# model.add(Activation('softmax'))

# 自己定义RMSprop
rmsprop = RMSprop(lr=0.001, rho=0.9, epsilon=1e-08, decay=0.0)

# 开始创建网络,使用我们自己定义的rmsprop,如果想使用默认的RMSprop也可是使用
# optimizer = 'rmsprop'来指定。
model.compile(optimizer=rmsprop,
              # 使用交叉熵损失函数
              loss='categorical_crossentropy',
              # 指定在过程中需要额外计算的东西
              metrics=['accuracy']
              )

# 开始训练
print('Training ----------')
# 使用fit来进行训练,epochs指训练几轮,一轮就是train的全部数据,这里是60000
# 这里一个epochs可以训练60000/32=1875轮,epochs=2,则一共训练3750轮
# batch_size=32指每训练一轮用多少数据,这个在显存能放得下的情况下,越大越好
model.fit(X_train, y_train, epochs=1, batch_size=32)

# 开始测试
print('\nTesting ----------')
loss, accuracy = model.evaluate(X_test, y_test)

print('test loss:', loss)
print('test accuracy:', accuracy)

注意前面GPU报错的处理办法。

四、使用keras的卷积网络对mnist分类

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

# 解决报错GPU运行报错的问题
# 这里导入tf,用来修改tf后端的配置
import tensorflow as tf
from keras.backend.tensorflow_backend import set_session
config = tf.ConfigProto()
# 将显存容量调到只会使用30%
config.gpu_options.per_process_gpu_memory_fraction = 0.3
# 使用设置好的配置
set_session(tf.Session(config=config))


import numpy as np

np.random.seed(1337)
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Activation, Convolution2D, MaxPooling2D, Flatten
from keras.optimizers import Adam

(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 改变结构,-1表示默认的样本数,1表示channels这里是灰度图片,28*28表示图片大小
# 卷积网络要使用图片的格式
X_train = X_train.reshape(-1, 1, 28, 28)
X_test = X_test.reshape(-1, 1, 28, 28)
# 将标签变换为onehot格式
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)

model = Sequential()
# 添加第一个卷积层,32个核,核尺寸为5*5,步长为1,填充为same,激活函数为relu,输入为1*28*28
model.add(Convolution2D(
    filters=32,
    kernel_size=(5, 5),
    strides=1,
    padding='same',
    activation='relu',
    input_shape=(1, 28, 28)
))
# 添加一个pool层,类型为Maxpooling,核尺寸为2*2,步长为2,填充为same
model.add(MaxPooling2D(
    pool_size=(2, 2),
    strides=2,
    padding='same'
))
# 添加第二个卷积层,64个核,大小为5*5,填充为same,激活函数为relu
model.add(Convolution2D(
    filters=64,
    kernel_size=(5, 5),
    padding='same',
    activation='relu',
))
# 添加Maxpooling层,尺寸为2*2,填充为same
model.add(MaxPooling2D(
    pool_size=(2, 2),
    strides=2,
    padding='same'
))
# 将得到的卷积层给抹平,然后提供给全连接层
model.add(Flatten())
# 添加一个全连接层,node为1024(输出为1024)
model.add(Dense(1024))
# 给第一个全连接层加一个激活函数relu
model.add(Activation("relu"))
# 添加第二个全连接层,node为10(输出为10)
model.add(Dense(10))
# 为第二个全连接层添加激活函数softmax作分类输出
model.add(Activation("softmax"))

# 使用adam优化器
adam = Adam(lr=1e-4)

# 创建网络,使用交叉熵损失函数,输出accuracy
model.compile(optimizer=adam,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# 开始训练,每个batch为32,跑一个epoch
print("Training ----------")
model.fit(X_train, y_train, epochs=1, batch_size=32)
# 开始测试,输出损失值和准确度
print("Testing ----------")
loss, accuracy = model.evaluate(X_test, y_test)

print("Loss:", loss)
print("Accuracy:", accuracy)

五、使用RNN来分类Mnist

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

# 解决报错GPU运行报错的问题
# 这里导入tf,用来修改tf后端的配置
import tensorflow as tf
from keras.backend.tensorflow_backend import set_session

config = tf.ConfigProto()
# 将显存容量调到只会使用30%
config.gpu_options.per_process_gpu_memory_fraction = 0.3
# 使用设置好的配置
set_session(tf.Session(config=config))

import numpy as np

np.random.seed(1337)

from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import SimpleRNN, Activation, Dense
from keras.optimizers import Adam

# 一个图片28行,我们看作是28个时间点
TIME_STEP = 28
# 输入大小,就是每一行的像素点个数
INPUT_SIZE = 28
# 每一轮训练的样本数(图片个数)
BATCH_SIZE = 50
BATCH_INDEX = 0
# 输出维度10
OUTPUT_SIZE = 10
# RNN单元中node个个数
CELL_SIZE = 50
# 学习率为0.001
LR = 0.001

# 读取数据
(X_train, y_train), (X_test, y_test) = mnist.load_data()
# 数据预处理
# 将训练数据和测试数据都转换为 m*28*28,并且归一化
X_train = X_train.reshape(-1, 28, 28) / 255
X_test = X_test.reshape(-1, 28, 28) / 255
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)

model = Sequential()

model.add(SimpleRNN(
    # 输入一个batch的shape为50*28*28
    # 当使用batch_input_shape规定了batch大小后,测试时会要求满足这个大小
    #batch_input_shape=(BATCH_SIZE, TIME_STEP, INPUT_SIZE),
    # 选择使用input_shape,从而不影响测试时输入大小
    input_shape=(TIME_STEP, INPUT_SIZE),
    units=CELL_SIZE,
    # tanh也是默认值
    activation='tanh'
))
# 定义输出层,输出为10
model.add(Dense(OUTPUT_SIZE))
model.add(Activation('softmax'))

adam = Adam(LR)

model.compile(optimizer=adam,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

for step in range(4001):
    # 每次获取一个batch_size的数据集
    X_batch = X_train[BATCH_INDEX:BATCH_INDEX + BATCH_SIZE, :, :]
    y_batch = y_train[BATCH_INDEX:BATCH_INDEX + BATCH_SIZE, :]
    # 训练一次,返回cost
    cost = model.train_on_batch(X_batch, y_batch)
    BATCH_INDEX += BATCH_SIZE
    # 如果训练集跑完了一轮,将BATCH_INDEX置0,继续跑
    BATCH_INDEX = 0 if BATCH_INDEX >= X_train.shape[0] else BATCH_INDEX
    # 每500测试一次,打印一次cost和accuracy
    if step % 500 == 0:
        cost, accuracy = model.evaluate(X_test, y_test, batch_size=10000, verbose=False)
        print("Cost:", cost, "Accuracy:", accuracy)

六、使用LSTM来进行回归

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

# 解决报错GPU运行报错的问题
# 这里导入tf,用来修改tf后端的配置
import tensorflow as tf
from keras.backend.tensorflow_backend import set_session

config = tf.ConfigProto()
# 将显存容量调到只会使用30%
config.gpu_options.per_process_gpu_memory_fraction = 0.3
# 使用设置好的配置
set_session(tf.Session(config=config))

import numpy as np

np.random.seed(1337)

from keras.models import Sequential
from keras.layers import LSTM, TimeDistributed, Dense
from keras.optimizers import Adam
import matplotlib.pyplot as plt

BATCH_START = 0
# 每次20个数据为一个序列
TIME_STEPS = 20
# 一个批次为50个序列
BATCH_SIZE = 50
# 每个输入为1,一个sin的值
INPUT_SIZE = 1
# 每个输出也为1,一个cos的值
OUTPUT_SIZE = 1
# RNN循环单元中node个数量
CELL_SIZE = 20
# 学习率为0.006
LR = 0.006


# 准备数据,每次获取一个batch的数据,每个batch中的sin和cos是连续的
def get_batch():
    global BATCH_START, TIME_STEPS
    # 每一次batch对应X轴的数据,转化为50*20
    xs = np.arange(BATCH_START, BATCH_START + TIME_STEPS * BATCH_SIZE).reshape((BATCH_SIZE, TIME_STEPS))
    # X对应的sin数据,50*20
    seq = np.sin(xs)
    # X对应的cos数据,50*20
    res = np.cos(xs)
    BATCH_START += TIME_STEPS

    # plt.plot(xs[0,:],res[0,:],'r',xs[0,:],seq[0,:],'b--')
    # plt.show()

    # 返回数据,格式为[50*20*1,50*20*1,50]
    return [seq[:, :, np.newaxis], res[:, :, np.newaxis], xs]


model = Sequential()

model.add(LSTM(
    batch_input_shape=(BATCH_SIZE, TIME_STEPS, INPUT_SIZE),
    units=CELL_SIZE,
    # 是否在RNN的每次循环中都做输入,默认是False,即只在最后输出结果
    return_sequences=True,
    # 两次batch之间是否是有联系的,即第一个batch的最后一部的输出a是否作为第二个batch的第一个输入
    stateful=True
))
# 按时间分割的全链接,即对RNN的每一次循环都添加一个全连接进行输出,输出维度为1。
model.add(TimeDistributed(Dense(OUTPUT_SIZE)))

adam = Adam(LR)

model.compile(optimizer=adam,
              loss='mse')

print("Train ----------")
# 使用plt.ion开启交互模式
plt.ion()

for step in range(501):
    X_batch, y_batch, xs = get_batch()
    cost = model.train_on_batch(X_batch, y_batch)
    pred = model.predict(X_batch, BATCH_SIZE)

    # 避免在图中重复的画线,线尝试删除已经存在的线
    try:
        # 每次画图之前清空前面的图形,不然就是累加
        plt.clf()
    except Exception:
        pass

    plt.plot(xs[0, :], y_batch[0].flatten(), 'r', xs[0, :], pred.flatten()[:TIME_STEPS], 'b--')
    # 暂停一下,否则会卡
    plt.pause(0.1)
    if step % 10 == 0:
        print('tiran cost: ', cost)

keras学习笔记-bili莫烦

七、使用keras实现自编码(autoencoder)

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

# 解决报错GPU运行报错的问题
# 这里导入tf,用来修改tf后端的配置
import tensorflow as tf
from keras.backend.tensorflow_backend import set_session

config = tf.ConfigProto()
# 将显存容量调到只会使用30%
config.gpu_options.per_process_gpu_memory_fraction = 0.3
# 使用设置好的配置
set_session(tf.Session(config=config))

import numpy as np

np.random.seed(1337)

import matplotlib.pyplot as plt
from keras.datasets import mnist
# 这里直接使用Model,而没有使用Sequential
from keras.models import Model
from keras.layers import Dense, Input

# 导入matplotlib中的3D模块
from mpl_toolkits import mplot3d

# 导入数据,但在这个例子中,由于自编码是属于无监督,所以只需要X_train和X_test
# y_test主要用于最后画3D图时用作颜色区分
(X_train, _), (X_test, y_test) = mnist.load_data()

# 预处理数据,将数据全部归一化为[-0.5,0.5]范围
X_train = X_train.astype('float32') / 255. - 0.5
X_train = X_train.reshape((X_train.shape[0], -1))
X_test = X_test.astype('float32') / 255. - 0.5
X_test = X_test.reshape((X_test.shape[0], -1))

# 我们确定将encoder的输出维度定为3(画3D图)
encoding_dim = 3

# 定义输入
input_img = Input(shape=(784,))

# 定义encoder部分
encoded = Dense(128, activation='relu')(input_img)
encoded = Dense(64, activation='relu')(encoded)
encoded = Dense(10, activation='relu')(encoded)
encoder_output = Dense(encoding_dim, )(encoded)

# 定义decoder部分
decoded = Dense(10, activation='relu')(encoder_output)
decoded = Dense(64, activation='relu')(decoded)
decoded = Dense(128, activation='relu')(decoded)
decoded = Dense(784, activation='tanh')(decoded)

# 自编码整体结构
autoencoder = Model(inputs=input_img, outputs=decoded)
# 仅编码部分
encoder = Model(inputs=input_img, outputs=encoder_output)

# 构建
autoencoder.compile(optimizer='adam', loss='mse')
# 训练20epochs,每个batch为256,并打乱顺序
autoencoder.fit(X_train, X_train, epochs=20, batch_size=256, shuffle=True)

# 使用仅编码部分结构来进行预测,即生成编码后的3维数据
encoded_img = encoder.predict(X_test[1000:])

# 使用3D绘图
ax = plt.axes(projection='3d')
# 画3D图(只画了X_test中的前1000个点,避免卡)
ax.scatter3D(encoded_img[:, 0], encoded_img[:, 1], encoded_img[:, 2], c=y_test[1000:], s=1)
plt.show()

keras学习笔记-bili莫烦

八、模型保存和载入

 

from keras.models import Sequential
from keras.models import load_model

# 直接保存整个model
# 使用HDF5格式保存需要安装h5py包
model.save('my_model.h5')
# 载入整个model
model = load_model('my_model.h5')

# 只保存weights
model.save_weights('my_model_weights.h5')
model.load_weights('my_model_weights.h5')

# 只保存网络结构
from keras.models import model_from_json
json_string = model.to_json()
model = model_from_json(json_string)