2.1 理解TensorFlow 1.x_深度学习实战：基于TensorFlow 2和Keras（原书第2版）-QQ阅读男频武侠网

上QQ阅读APP看书，第一时间看更新

2.1　理解TensorFlow 1.x

通常来说，学习使用任何计算机语言时，编写的第一个程序都是“Hello World”。在本书中我们也保持惯例！从Hello World程序开始：

让我们细看下这段简单的代码。第一行导入了tensorflow，第二行使用tf.con-stant定义了变量message，第三行使用with定义了Session()，第四行使用run()运行上述会话（session）。注意，这时的运行结果是“字节字符串”（byte string）。为了移除字符串引号和b（对于字节），使用了decode()方法。

2.1.1　TensorFlow 1.x计算图程序结构

TensorFlow 1.x不同于其他编程语言，需要先为要创建的神经网络构建一个蓝图，具体实现是通过将程序分为两个部分：定义计算图和执行计算图。

计算图

计算图是由节点和边构成的神经网络。在本节中，要使用的数据称为张量对象（常量、变量、占位符）。要执行的计算称为操作对象。每个节点可以有零个或多个输入，但只有一个输出。网络中的节点表示对象（张量和操作），边表示不同操作之间传递的张量。计算图定义了神经网络的蓝图，但其中的张量尚未与“值”关联。

011-02 占位符只是一个变量，随后会为其分配数据。它让我们不需要数据即可构建计算图。

要构建一个计算图，需要定义所有用到的常量、变量和操作。在后续几节中，我们使用一个简单示例来描述计算图的程序结构，定义并执行一个图来添加两个向量。

计算图执行

计算图的执行由会话对象实现，它封装了张量对象和操作对象求值运算的环境。实际的计算过程和信息的层际传递都在此部分发生。在此之前，所有张量对象的值仅仅是被初始化、访问以及保存在会话对象中，这只是一些抽象定义。直至执行时，它们才开始有了“生命”。

为什么要使用计算图

使用计算图有很多原因。首先，计算图是描述（深度）神经网络最自然的隐喻。其次，可通过移除通用子表达式、融合内核以及剪除多余表达式等方法对计算图进行自动优化。再次，在训练过程中可轻松分发计算图，并将其部署到不同的运行环境（比如CPU、GPU或TPU，以及云、物联网、移动或传统服务器）中。总之，如果你熟悉函数式编程，那么计算图就是一个常用概念，可把它看作简单基本类型的组合（这在函数式编程中很常见）。TensorFlow从计算图中借鉴了很多概念，并做了一些内部优化。

从一个示例开始

对于一个将两个向量相加的简单示例，其计算图如下所示。

定义计算图的相应代码为：

在会话中执行图：

或者：

结束后会打印两个向量的和：

记住，每个会话都需要使用close()显式关闭。

计算图的构建非常简便，只需添加变量和运算并将它们传递（使张量流动）。如此你就可以逐层构建神经网络。另外，TensorFlow还允许使用tf.device()将特定设备（CPU/GPU）与不同的计算图对象一起使用。在示例中，计算图由三个节点组成。其中，v_1和v_2表示两个向量，v_add表示要在v_1和v_2上执行的操作。现在，为了使该图生效，首先需要使用tf.Session()定义一个会话对象。我们将会话对象命名为sess。接下来，使用Session类中定义的run方法运行它：

该方法将评估fetches参数的张量。示例中fetches参数的张量为v_add。run方法将执行图中导入v_add的每个张量和每个操作。假如fetches是v_1而不是v_add，则结果将是向量v_1的值：

fetches可以是单个（或多个）张量对象或者操作对象。例如，如果fetches为[v_1，v_2，v_add]，则输出为：

同一程序代码中可以有许多会话对象。在本节中，我们看到了TensorFlow 1.x的计算图程序结构的示例。下面将更详细地介绍TensorFlow 1.x的编程结构。

2.1.2　常量、变量和占位符的使用

简而言之，TensorFlow提供了一个库用来定义和执行带有张量的不同数学运算。张量一般是n维数组。所有类型的数据（即标量、向量和矩阵）都是张量的特殊类型：

TensorFlow支持三种类型的张量：

1. 常量：常量是值不可变的张量。

2. 变量：当在会话中需要更新值时，应使用变量张量。例如，神经网络在训练期间需要更新权重，这通过将权重声明为变量来实现。变量在使用前需要进行显式初始化。另外要注意，常量存储在计算图定义中，而且每次加载图时都会加载它们，所以会占用大量内存。与之不同，变量是独立存储的，可以存储在参数服务器上。

3. 占位符：占位符用于将值注入TensorFlow的计算图中，通常与参数feed_dict一起来注入数据。在训练神经网络时，通常用来提供新的训练示例。在会话中运行计算图时，我们将值分配给占位符。它们使我们无须任何数据即可创建操作对象并构建计算图。需要注意的重要细节是，占位符不含任何数据，因此无须初始化。

2.1.3　操作对象示例

让我们看看TensorFlow 1.x中一些不同操作对象的示例。

1. 常量

下面是一些常见的常量。

声明一个标量常量：

示例：形状为[1, 3]的常数向量：

使用tf.zeros()创建一个所有元素都为零的张量。以下语句创建数据类型为dtype（int32、float32等），形状为[M，N]的零矩阵：

示例：zero_t = tf.zeros([2,3],tf.int32) ==>[[0 0 0], [0 0 0]]

获取张量的形状：

示例：print(tf.zeros([2,3],tf.int32).shape) ==> (2, 3)

还可用以下代码创建与现有NumPy数组形状相同的张量变量或张量常量：

创建一个所有元素为1的张量。接下来，创建一个形状为[M，N]的ones矩阵：

示例：ones_t = tf.ones([2,3],tf.int32) ==>[[0 0 0], [0 0 0]]

可以用与NumPy相似的方式进行广播：

示例：t = tf.Variable([[0., 1., 2.], [3., 4., 5.], [6., 7., 8]])

2. 序列

生成在起止区间内均匀间隔，总长度为num的等距向量序列：

示例：range_t = tf.linspace(2.0,5.0,5) ==> [ 2. 2.75 3.5 4.25 5. ]

生成从start（默认为0）开始、增量为delta（默认为1）且不包括limit的数字序列：

示例：range_t = tf.range(10) ==> [0 1 2 3 4 5 6 7 8 9]

3. 随机张量

TensorFlow允许创建具有不同分布特征的随机张量：

为创建服从形状[M，N]、均值mean（默认为0.0）、标准差stddev（默认为1.0）和seed的正态分布的随机值，可使用：

为创建服从形状[M，N]、均值mean（默认为0.0）、标准差stddev（默认为1.0）和seed的截断正态分布的随机值，可使用：

为创建服从形状[M，N]、区间[minval（默认为0），maxval]和seed的gamma分布的随机值，可使用：

将给定张量随机裁剪为指定大小：

每当需要以随机顺序呈现训练样本时，都可使用tf.random_shuffle()方法沿张量的第一维度随机洗牌张量。假设t_random是待洗牌的张量，可使用：

随机生成的张量会受到初始种子值的影响。为了在多个运行或会话中获得相同的随机数，应将种子设置为一个常量值。在大量使用随机张量时，可用tf.set_random_seed()为所有随机生成的张量设置种子。以下命令将所有会话的随机张量的种子设置为54：

4. 变量

使用类tf.Variable创建变量。定义变量应包括初始化常数或随机值。在下面的代码中，我们创建了两个不同的张量变量t_a和t_b。用形状[50, 50]、minval=0和maxval=10的随机均匀分布对它们进行初始化：

变量常用于表示神经网络的权重和偏差：

此处，我们用可选参数name为计算图中定义的变量命名。在上述所有示例中，变量初始化源自一个常量。我们还可以指定另一个变量来初始化变量。以下语句用上面定义的权重初始化weight2：

初始化变量：变量的定义需要指定如何初始化，因为必须显式初始化所有声明的变量。在计算图的定义中，通过声明一个操作对象来实现这一点：

运行计算图时，还可以使用tf.Variable.initializer分别初始化每个变量：

保存变量：可以使用Saver类保存所有变量。为此，定义一个操作对象saver：

占位符：采用如下语法定义占位符：

dtype用来指定placeholder的数据类型，且须声明时指定。下面，我们将x定义为占位符，并使用feed_dict计算随机4×5矩阵的y = 2x（记住，feed_dict用于将值注入TensorFlow占位符中）：

所有变量和占位符都在代码的“计算图”部分中确定。如果在定义部分中使用print语句，则将仅获得有关张量类型的信息，而不是张量的值。

要获知其值，我们需要创建会话图，并使用所需的张量值显式运行run命令，代码如下所示：

2.1.4　TensorFlow 2.x中的TensorFlow 1.x示例

我们可以看到TensorFlow 1.x API为创建和操控表示（深度）神经网络和其他类型机器学习程序的计算图提供了灵活的方式。相对而言，TensorFlow 2.x提供了更高级别的API，这些API抽象隐藏了更多的底层实现细节。最后，让我们回到上一章中遇到的TensorFlow 1.x程序示例。此处，我们还添加了一行代码来显示计算图：