1 RandomState 的应用场景概述
在训练神经网络时,苦于没有数据,此时numpy为我们提供了 “生产” 数据集的一种方式。
例如在搭建神经网络(一)中的 4.3 准备数据集 章节中就是采用np.random.mtrand.RandomState “生产” 数据的。
常用的方式如下
import numpy as np # 设置seed值,生成ndarray对象 SEED = 23455 # 基于seed产生随机数 rdm = np.random.mtrand.RandomState(SEED) # rand函数产生随机数,返回32行2列矩阵 # 32行代表32组数据,2代表输入数据的2个特征 X = rdm.rand(32, 2) # 为每组数据制备标签 # 若(体积+重量) ≥ 1,则 Y 赋值 0 # 若(体积+重量) < 1,则 Y 赋值 1 # Y 值为输入数据集的标签(正确答案),这里记为 Y_ Y_ = [[int(x0 + x1 < 1)] for (x0, x1) in X] # 在神经网络中,print函数是可不写的 # 此处仅为了便于观察过程数据 print("X:\n",X) print("Y_:\n",Y_)
2 RandomState 对象介绍
为了更为清晰地看RandomState,使用help函数打印出RandomState信息。
无论是从命名规则和帮助文档可确定RandomSate是一个类。
import numpy as np rdm = np.random.mtrand.RandomState() print(rdm)
运行
<mtrand.RandomState object at 0x00000166B6599BD0>
2.1 RandomState用途
RandomState作为Mersenne Twister伪随机数发生器的容器。
RandomState类中有许多方法,用于从各种概率分布中生成随机数。类中的每个方法都有特定于分布的参数,但所有方法中都包含有一个 'size' 参数。
- None - 生成并返回单个值
- 整数integer - 生成并返回一个生成值的1-D数组
- 元组tuple- 生成并返回一个具有该形状shape的数组。
类中的方法及其方法中的参数详见 numpy.random.mtrand.RandomState
备注:
类RandomState调用的固定的种子和系列( A fixed seed and a fixed series)等相同的参数将会产生相同的结果,也可理解为类RandomState中使用相同integer或array_like参数等固定种子将会产生相同的结果。
Python stdlib模块 “random” 还包含一个Mersenne Twister伪随机数生成器,其中有许多方法类似于`RandomState`中可用的方法。 除了NumPy感知之外,`RandomState`的优点是它提供了更多的概率分布可供选择。
2.2 类的参数
可选参数为随机种子seed(用于初始化initialize伪随机数pseudo-random number生成器igenerator),可以是0~2**32-1间的任一整数integer,或array_like(array or other sequence)的整数integers。或默认值None。
- None - 生成并返回单个值,此时RandomState将尝试从‘/dev/urandom’或windows analogue读取数据(如果可用),否则将从时钟clock读取种子seed。
- int - 生成并返回一个生成值的一维数组
- array_like - 生成并返回一个具有该形状shape的数组。
2.3 RandomState的引用方法
# 两个语句等价 # 可认为是简写版 rdm = np.random.RandomState(SEED) # 在多场合可看到的版本 rdm = np.random.mtrand.RandomState(SEED)
在官方文档中(numpy.random.mtrand.RandomState)看到的结果。
2.4 RandomState的结果值
由于RandomState是类,所以打印不出具体结果,是对象地址
<mtrand.RandomState object at 0x00000170BB6A9AF8>
当使用RandomState类中的方法时,就可以print出具体值。但不同的方法function会得到不同的结果。
rand()方法就可以得到0~1的随机值。
import tensorflow as tf import numpy as np SEED = 23455 rdm = np.random.mtrand.RandomState(SEED) print(rdm) a = rdm.rand(32,2) print(a)
运行
<mtrand.RandomState object at 0x00000170BB6A9AF8> [[0.83494319 0.11482951] [0.66899751 0.46594987] [0.60181666 0.58838408] [0.31836656 0.20502072] [0.87043944 0.02679395] [0.41539811 0.43938369] [0.68635684 0.24833404] [0.97315228 0.68541849] [0.03081617 0.89479913] [0.24665715 0.28584862] [0.31375667 0.47718349] [0.56689254 0.77079148] [0.7321604 0.35828963] [0.15724842 0.94294584] [0.34933722 0.84634483] [0.50304053 0.81299619] [0.23869886 0.9895604 ] [0.4636501 0.32531094] [0.36510487 0.97365522] [0.73350238 0.83833013] [0.61810158 0.12580353] [0.59274817 0.18779828] [0.87150299 0.34679501] [0.25883219 0.50002932] [0.75690948 0.83429824] [0.29316649 0.05646578] [0.10409134 0.88235166] [0.06727785 0.57784761] [0.38492705 0.48384792] [0.69234428 0.19687348] [0.42783492 0.73416985] [0.09696069 0.04883936]]