1 RandomState 的应用场景概述

在训练神经网络时，苦于没有数据，此时numpy为我们提供了 “生产” 数据集的一种方式。

例如在搭建神经网络（一）中的 4.3 准备数据集 章节中就是采用np.random.mtrand.RandomState “生产” 数据的。

常用的方式如下

import numpy as np

# 设置seed值，生成ndarray对象
SEED = 23455

# 基于seed产生随机数
rdm = np.random.mtrand.RandomState(SEED)

# rand函数产生随机数，返回32行2列矩阵
# 32行代表32组数据，2代表输入数据的2个特征
X = rdm.rand(32, 2)

# 为每组数据制备标签
# 若（体积+重量） ≥ 1，则 Y 赋值 0
# 若（体积+重量） < 1，则 Y 赋值 1
# Y 值为输入数据集的标签（正确答案），这里记为 Y_
Y_ = [[int(x0 + x1 < 1)] for (x0, x1) in X]

# 在神经网络中，print函数是可不写的
# 此处仅为了便于观察过程数据
print("X:\n",X)
print("Y_:\n",Y_)

2 RandomState 对象介绍

为了更为清晰地看RandomState，使用help函数打印出RandomState信息。

无论是从命名规则和帮助文档可确定RandomSate是一个类。

numpy中的np.random.mtrand.RandomState

import numpy as np

rdm = np.random.mtrand.RandomState()
print(rdm)

运行

<mtrand.RandomState object at 0x00000166B6599BD0>

2.1 RandomState用途

RandomState作为Mersenne Twister伪随机数发生器的容器。

RandomState类中有许多方法，用于从各种概率分布中生成随机数。类中的每个方法都有特定于分布的参数，但所有方法中都包含有一个 'size' 参数。

None - 生成并返回单个值
整数integer - 生成并返回一个生成值的1-D数组
元组tuple- 生成并返回一个具有该形状shape的数组。

类中的方法及其方法中的参数详见 numpy.random.mtrand.RandomState

备注：

类RandomState调用的固定的种子和系列（ A fixed seed and a fixed series）等相同的参数将会产生相同的结果，也可理解为类RandomState中使用相同integer或array_like参数等固定种子将会产生相同的结果。

Python stdlib模块 “random” 还包含一个Mersenne Twister伪随机数生成器，其中有许多方法类似于`RandomState`中可用的方法。除了NumPy感知之外，`RandomState`的优点是它提供了更多的概率分布可供选择。

2.2 类的参数

numpy中的np.random.mtrand.RandomState

可选参数为随机种子seed（用于初始化initialize伪随机数pseudo-random number生成器igenerator），可以是0~2**32-1间的任一整数integer，或array_like（array or other sequence）的整数integers。或默认值None。

None - 生成并返回单个值，此时RandomState将尝试从‘/dev/urandom’或windows analogue读取数据（如果可用），否则将从时钟clock读取种子seed。
int - 生成并返回一个生成值的一维数组
array_like - 生成并返回一个具有该形状shape的数组。

2.3 RandomState的引用方法

# 两个语句等价

# 可认为是简写版
rdm = np.random.RandomState(SEED) 
# 在多场合可看到的版本
rdm = np.random.mtrand.RandomState(SEED)

在官方文档中（numpy.random.mtrand.RandomState）看到的结果。

numpy中的np.random.mtrand.RandomState

2.4 RandomState的结果值

由于RandomState是类，所以打印不出具体结果，是对象地址

<mtrand.RandomState object at 0x00000170BB6A9AF8>

当使用RandomState类中的方法时，就可以print出具体值。但不同的方法function会得到不同的结果。

rand()方法就可以得到0~1的随机值。

import tensorflow as tf
import numpy as np
SEED = 23455

rdm = np.random.mtrand.RandomState(SEED)
print(rdm)
a = rdm.rand(32,2)
print(a)

运行

<mtrand.RandomState object at 0x00000170BB6A9AF8>
[[0.83494319 0.11482951]
 [0.66899751 0.46594987]
 [0.60181666 0.58838408]
 [0.31836656 0.20502072]
 [0.87043944 0.02679395]
 [0.41539811 0.43938369]
 [0.68635684 0.24833404]
 [0.97315228 0.68541849]
 [0.03081617 0.89479913]
 [0.24665715 0.28584862]
 [0.31375667 0.47718349]
 [0.56689254 0.77079148]
 [0.7321604  0.35828963]
 [0.15724842 0.94294584]
 [0.34933722 0.84634483]
 [0.50304053 0.81299619]
 [0.23869886 0.9895604 ]
 [0.4636501  0.32531094]
 [0.36510487 0.97365522]
 [0.73350238 0.83833013]
 [0.61810158 0.12580353]
 [0.59274817 0.18779828]
 [0.87150299 0.34679501]
 [0.25883219 0.50002932]
 [0.75690948 0.83429824]
 [0.29316649 0.05646578]
 [0.10409134 0.88235166]
 [0.06727785 0.57784761]
 [0.38492705 0.48384792]
 [0.69234428 0.19687348]
 [0.42783492 0.73416985]
 [0.09696069 0.04883936]]

秒客网

numpy中的np.random.mtrand.RandomState

1 RandomState 的应用场景概述

2 RandomState 对象介绍

2.1 RandomState用途

2.2 类的参数

2.3 RandomState的引用方法

2.4 RandomState的结果值

相关文章