浅析Java源码之Math.random()

从零自学java消遣一下，看书有点脑阔疼，不如看看源码！(๑╹◡╹)ﾉ"""

JS中Math调用的都是本地方法，底层全是用C++写的，所以完全无法观察实现过程，Java的工具包虽然也有C/C++的介入，不过也有些是自己实现的。

本篇文章主要简单阐述Math.random()的实现过程。

Math隶属于java.lang包中，默认加载。本身是一个final类，方法都是静态方法，所以使用的时候不需要生成一个实例，直接调用Math.XX就行了。

一步一步观察该方法，首先是java.lang.Math：

public final class Math {

  // 大量静态变量与方法

  // ...

  private static Random randomNumberGenerator;

  private static synchronized void initRNG() {

    if (randomNumberGenerator == null)

      randomNumberGenerator = new Random();

  }

  public static double random() {

    if (randomNumberGenerator == null) initRNG();

    return randomNumberGenerator.nextDouble();

  }

  // ...other

}

这里面与random相关的操作有3个：

1、声明一个私有静态Random类randomNumberGenerator

2、若randomNumberGenerator未初始化，调用new Random()将其初始化

3、若randomNumberGenerator已经初始化，调用nextDouble方法并将其值返回

tips：synchronized关键字代表同步执行此方法，Java为多线程，所以为了保证randomNumberGenerator对象只被初始化一次，需要该关键字。比如两个线程同时调用了Math.random()，线程A发现rXX未被初始化，进入initRNG调用new Random()方法。此时线程B也发现了rXX未被初始化，但是initRNG是同步方法，所以挂起等待线程A执行完毕。当线程A执行完后把rXX初始化了，所以在initRNG中的if判断，线程B会直接返回。

所以简单来讲，random方法会在第一次调用时生成一个randomNumberGenerator对象，并调用其nextDouble方法生成随机数，之后的调用就只要持续调用此方法返回随机数就行了。

下面来看Random类是个什么鬼，来源于java.util.Random：

public class Random implements java.io.Serializable {

  // 静态变量

  /** use serialVersionUID from JDK 1.1 for interoperability */

  static final long serialVersionUID = 3905348978240129619L;

  private final AtomicLong seed;

  private final static long multiplier = 0x5DEECE66DL;

  private final static long addend = 0xBL;

  private final static long mask = (1L << 48) - 1;

  // constructor

  public Random() { this(++seedUniquifier + System.nanoTime()); }

  private static volatile long seedUniquifier = 8682522807148012L;

  public Random(long seed) {

    this.seed = new AtomicLong(0L);

    setSeed(seed);

  }

  // 设置种子

  synchronized public void setSeed(long seed) {

    seed = (seed ^ multiplier) & mask;

    this.seed.set(seed);

    haveNextNextGaussian = false;

  }

  // 产生大数字

  protected int next(int bits) {

    long oldseed, nextseed;

    AtomicLong seed = this.seed;

    do {

      oldseed = seed.get();

      nextseed = (oldseed * multiplier + addend) & mask;

    } while (!seed.compareAndSet(oldseed, nextseed));

    return (int)(nextseed >>> (48 - bits));

  }

  // 生成随机数

  public double nextDouble() {

    return (((long)(next(26)) << 27) + next(27))

      / (double)(1L << 53);

  }

  // 其他不关心的方法

  // nextBytes(bytes [])

  // nextInt

  // nextInt(int)

  // nextLong

  // nextBoolean

  // nextFloat

  // Serializable相关

}

上述代码剔除了大量的注释，还有一些不需要关心的方法，本文只关注Math.random()调用相关方法。

对于这个类，首先来看看它的构造函数，理论上new一个Random实例是需要一个long类型的整数作为参数，但是代码用了this使其默认调用new Random(long)这个构造函数。而在构造函数中又生成了一个新类并赋值给实例变量seed，关于这个AtomicLong类其实没啥好讲的，简单看一下就行：

public class AtomicLong extends Number implements java.io.Serializable {

  private static final long serialVersionUID = 1927816293512124184L;

  // valueOffset相关...

  // 实例变量

  private volatile long value;

  // 构造函数

  public AtomicLong(long initialValue) {

    value = initialValue;

  }

  public AtomicLong() {}

  // 方法

  public final long get() {

    return value;

  }

  public final void set(long newValue) {

    value = newValue;

  }

  // 这个也会用到 但是不用关心具体实现

  public final boolean compareAndSet(long expect, long update) {

    return unsafe.compareAndSwapLong(this, valueOffset, expect, update);

  }

  // 其余不需要关心（其实我也看不懂）的方法

}

如果思想简单一点，可以看出这个类也很简单，初始化传参赋值，set设置，get获取，多简单！

现在回到Random类的构造函数中，实例变量被赋值，类的value为初始化的0(后缀L代表这是一个long类型整数)。下一步调用setSeed，传入构造函数的long类型seed变量(不是seed类)，其值为：

++seedUniquifier + System.nanoTime()

// private static volatile long seedUniquifier = 8682522807148012L(8.6825e+15);

// 2^52 ~ 2^53

// 写文章时测试 => System.nanoTime() => 13230650355964(1.323e+13);

其中第一个变量为一个固定值，每次加1，另外一个为System.nanoTime()，该方法返回一个与当前时间相关的数字，具体我不关心。

两个相加后，作为初始种子出传入setSeed方法中，方法第一步会对seed进行二次计算：

seed = (seed ^ multiplier) & mask;

// private final static long multiplier = 0x5DEECE66DL;(25214903917 => 2.5214e+10)

// 2^34 ~ 2^35

// private final static long mask = (1L << 48) - 1;(2^48-1 => 0111...1 => 2^48 = 2.8147+e14)

此处进行的是位运算，这里不用关心具体数值，只关注可能得到的最大最小值。

^ => 异或运算：3 ^ 4 => 011 ^ 100 = 111 => 7(不一样置1，否则置0)

可以看出，两个数字异或运算，假设其中较大的二进制位数为n，结果一定是小于等于2^{n-1，比如3}4，4为100三位，所以结果一定小于等于2^3-1，即7。

& => 与运算：3 & 4 => 011 & 100 = 000 => 0(都为1置1，否则置0)

可以看出，与运算的结果总是小于等于较小的那个数。

这样来再来看之前的位运算：

seed(2^52 ~ 2^53) ^ multiplier(2^34 ~ 2^35) => 0 ~ (2^53-1)

(seed ^ multiplier)(0 ~ 2^53-1) & mask(2^48-1) => 0 ~ 2^48-1

结论是种子的范围是在0 ~ 2^48-1之间。

测试代码：

public class test {

  public static void main(String [] args){

    pro b = new pro();

    System.out.println(b.getValue());

    // 256403749474577

    // 256458702577093

    // 256431328421593

  }

}

class pro{

  long seed = 8682522807148012L + System.nanoTime();

  long multiplier = 0x5DEECE66DL;

  long mask = (1L << 48) - 1;

  long getValue(){

    return (seed ^ multiplier) & mask;

  }

}

构造函数调用完后，现在来看nextDouble，这个方法除去位运算，本质上就是调用了两次next方法：

public double nextDouble() {

  return (((long)(next(26)) << 27) + next(27))

    / (double)(1L << 53);

}

所以直接看next方法：

protected int next(int bits) {

  long oldseed, nextseed;

  AtomicLong seed = this.seed;

  do {

    oldseed = seed.get();

    nextseed = (oldseed * multiplier + addend) & mask;

  } while (!seed.compareAndSet(oldseed, nextseed));

  return (int)(nextseed >>> (48 - bits));

}

方法内部声明了2个long类型种子：oldseed、nextseed，通过get方法取得之前位运算得到的seed赋值给oldseed，然后再次通过运算得到一个nextseed的值，并传给seed.compareAndSet(oldseed, nextseed)方法中。

关于这个方法，源码里是这样的：

// java.util.concurrent.atomic.AtomicLong;

public class AtomicLong extends Number implements java.io.Serializable {

  public final boolean compareAndSet(long expect, long update) {

    return unsafe.compareAndSwapLong(this, valueOffset, expect, update);

  }

}

// sun.misc.Unsafe.java

public native boolean compareAndSwapLong(Object obj, long offset,long expect, long update);

这个方法是个内部方法，也就是用C/C++实现的，所以有兴趣的自己去看源码，这里贴一个blog：

http://www.cnblogs.com/Mainz/p/3546347.html

方法的用处简单讲也很简单，比较oldseed与内存中预期的值，如果符合，就将nextseed放进去。

这里的运算也不管具体数值，oldseed * multiplier按最大计算会出现溢位，截取成long类型后的大小不确定，所以按照与运算这里的范围依然是0 ~ mask，即0 ~ 2^48-1。

最后返回(int)(nextseed >>> (48 - bits))，这里对结果进行类型处理，贴一个类型范围图：

基本类型	最小值	最大值
byte	-2^7	2^7 - 1
short	-2^15	2^15 - 1
int	-2^31	2^31 - 1
long	-2^63	2^63 - 1

若结果是大于int类型最大值，超出的部分会被直接截取砍掉。

最后看nextDouble的计算式：

(((long)(next(26)) << 27) + next(27)) / (double)(1L << 53)

传入的bits分别为26与27，这时返回的随机数为：

(int)(nextseed >>> 22) 与 (int)(nextseed >>> 21)

>>>为无符号右移，具体意思就不解释了。

得到的结果范围大概是 0 ~ 2^26(27)-1，理论上在这里是不会超过int的最大值。

当seed(测试代码中的tmp)为mask时，此时计算会达到最大值：

(((long)(1L << 53)-1 ) / (double)(1L << 53)

测试代码：

public class test {

  public static void main(String [] args){

    testb bb = new testb();

    long a = (long)bb.getNext(26);

    long b = bb.getNext(27);

    double c = 1L << 53;

    double d = ((a<<27) +b)/c;

    // 0.99999999...

    System.out.println(d);

  }

}

class testb{

  long tmp = (1L<<48)-1;

  // long tmp = 0 => 0.0

  int getNext(int num){

    return (int)(tmp >>> (48 - num));

  }

}

当测试代码中tmp为0时，计算结果为最小值0。

每一次调用nextDouble，会生成不一样的seed，也就会返回不一样的数字。

这样就是整个随机数生成过程。

完结，撒花ヽ(ﾟ∀ﾟ)ﾒ(ﾟ∀ﾟ)ﾉ

秒客网

浅析Java源码之Math.random()

相关文章