Tensorflow学习：（一）tensorflow框架基本概念

一、Tensorflow基本概念

　　1、使用图（graphs）来表示计算任务，用于搭建神经网络的计算过程，但其只搭建网络，不计算

　　2、在被称之为会话（Session）的上下文（context）中执行图

　　3、使用张量（tensor）表示数据，用“阶”表示张量的维度。关于这一点需要展开一下

0阶张量称为标量，表示单独的一个数

1阶张量称为向量，表示一个一维数组

2阶张量称为矩阵，表示一个二维数组

……

张量是几阶的可以通过张量右边的方括号数来判断。例如 t = [ [ [ ] ] ]，显然这个为3阶。

　　4、通过变量（Variable）维护状态

　　5、使用feed和fetch可以为任意的操作赋值或者从其中获取数据

　　Tensorflow是一个编程系统，使用图（graphs）来表示计算任务，图（graphs）中的节点称之为op（operation），一个op获得0个或者多个Tensor，执行计算，产生0个或多个Tensor，Tensor看作是一个n维的数组或列表。图必须在会话（Session）里被启动。

二、tensorflow基本框架知识

1、会话

 import tensorflow as tf     # 简写方便一点

 # 创建两个常量(constant)

 m1=tf.constant([[3,3]])     #一行两列的矩阵，这里是矩阵乘法，所以是二维数组，注意书写格式以及矩阵乘法规则
 m2=tf.constant([[2],[3]])   #两行一列的矩阵

 # 创建一个矩阵乘法(matmul)的op

 product=tf.matmul(m1,m2)

 print(product)

　　运行会得到显示结果，其中MatMul为节点名，0代表第0个输出；shape是维度，（1，1）代表一行一列的张量，长度为1；dtype指数据类型为整型。

Tensor("MatMul:0", shape=(1, 1), dtype=int32)

　　结果并不是想象中的是一个具体数字，而是一个Tensor，这是因为之前提到过图必须在会话中运行，现在我们并未使用会话，所以只能得到一个Tensor。

　　定义会话有两种方法，一般使用第二种。

 # method 1

 sess=tf.Session()            # 将Session简写为sess

 result=sess.run(product)     # 调用run方法执行图，这个触发了三个op(操作)，两个常量的建立，矩阵的乘法

 print(result)

 sess.close()                 # 关闭会话

  # method 2

 with tf.Session() as sess:    # Session()后面的()因为代码提示里没有，所以很容易丢

     result=sess.run(product)

     print(result)             # with as的这种结构会自动关闭会话

运行显示结果为

[[15]]

注意：Session() 经常会写错，大小写问题和括号问题，都是典型错误，多加练习

2、变量

上文常量使用tf.constant()表示，变量是用tf.Variable()表示

 import tensorflow as tf

 x=tf.Variable([1,2])    # 定义一个变量，这里是张量的加减法，所以一维数组即可

 a=tf.constant([3,3])    # 定义一个常量

 sub=tf.subtract(x,a)    # 增加一个减法op

 add=tf.add(x,sub)       # 增加一个加法op

 init=tf.global_variables_initializer()   # 在tensorflow中使用变量要初始化，此条语句也可以初始化多个变量，这句代码提示没有(),多加练习

 with tf.Session() as sess:

     sess.run(init)                       # 变量初始化，也要放在会话中，才能执行

     print(sess.run(sub))

     print(sess.run(add))

　　运行将得到结果

[-2 -1]

[-1  1]

　　上述代码展示了变量的定义和初始化，但还没有体现变量的本质，下面一段代码实现变量a进行5次+1的操作

值得一提的是，在打印常量和变量时，不能像python中的直接print(a)，而是也需要放在sess.run()中。

 a=tf.Variable(0,name='counter')        # 创建一个变量初始化为0，并命名为counter。（此段代码中命名无作用）

 new_value = tf.add(a,1)                # 创建一个加法op，作用是使state加1

 update=tf.assign(a,new_value)          # 此句话是赋值op，在tensorflow中，赋值也需要对应的op

 init=tf.global_variables_initializer() # 变量初始化

 with tf.Session() as sess:

     sess.run(init)

     print(sess.run(a))

     for i in range(5):

         sess.run(update)

         print(sess.run(a))

　　运行，显示结果为

注意：初始化时，pycharm会代码提示 tf.global_variables_initializer，但往往会把括号漏掉，需注意

常用的op现在除了加减乘除，还多了个assign()的赋值op

3、Fetch

　　sess.run([fetch1,fetch2]) 进行多个op，注意格式

 import tensorflow as tf

 input1 = tf.constant(3.0)

 input2 = tf.constant(2.0)

 input3 = tf.constant(5.0)

 add = tf.add(input2,input3)

 mul = tf.multiply(input1,add)

 with tf.Session() as sess:

     result = sess.run([mul,add])       # 执行了两个op，要注意格式

     print(result)

　　运行，结果显示为

[21.0, 7.0]

　　这里需要提一下tf.matmul()是用于矩阵乘法，tf.multiply是用于点乘。正如上面这段代码的multiply

4、placeholder占位

　　定义变量时可先不输入具体数值，先占位，在会话中调用op时，再输入具体值。

import tensorflow as tf

input1 = tf.placeholder(tf.float32)      # 使用placeholder()占位，需要提供类型

input2 = tf.placeholder(tf.float32)

output = tf.multiply(input1,input2)

with tf.Session() as sess:

    print(sess.run(output,feed_dict={input1:8.0,input2:2.0}))  # 以字典形式输入feed_dict

　　运行，显示结果为

[ 16.]

占位多组数据以后再说在下一篇随笔会提到。

　　以上就是一些比较基本的tensorflow概念的描述和代码实现。

　本人初学者，有错误欢迎指出。感谢。

秒客网