java random.nextInt的坑及解决

时间:2021-11-23 08:53:33

java random.nextInt的坑

下面的代码

?
1
2
Random random = new Random();
Integer code = random.nextInt(len);

很简单的两句代码,需要注意两点

第一:nextInt的取值是[0,n) ,不包括n。如果是随机list,直接传list的size,不用担心下标越界。

api说明:

Returns a pseudorandom, uniformly distributed int value between 0 (inclusive) and the specified value (exclusive)

第二个:nextInt在数据量小的时候,重复概率比较高。比如现在有一个大小为6的list,我希望随机显示4条且不重复。正确的做法是每次得到随机数后,移除下标对于的对象。这样即使random重复了也没关系,因为下标对应数据移除后,同样的下标对应的对象是不一样的。

千万别像我之前的做法,遍历list,然后随机取到下标后,再去重。这样有时能得到4个,有时得不到。比如下标会出现 5,1,1,1,2,1.这样的话,最终list只会有三个。

之前一直没有怀疑是这段代码的问题,怀疑接口不稳定或者是数据不完整之类的。查日志还一直在看接口传递参数和返回参数,结果是因为对nextInt理解不深刻,在我印象中感觉randomInt是随机数且不重复的,不过事实证明我想多了。

java random.nextInt()不随机性

最近在研究算法,也写一些小程序,其中有一个是《算法导论》中的习题:描述RANDOM(a, b)过程的一种实现,它只调用RANDOM(0, 1),作为a和b的函数,你的程序的期望时间运行时间是多少?

这个题在网上已经有很多人给出了答案

我也自己写了一个算法,不过本文的主题不是针对这个问题,而是RANDOM(0, 1)的实现方法。我刚开始使用的是random.nextInt(0, 1)来取随机的0和1,也测试了其“随机性”,代码如下:

?
1
2
3
4
5
6
//用Random.nextInt(2)获取0,1随机数
//获取概率均为0.5,但不随机
public int randomBase0() {
 Random r = new Random();
 return r.nextInt(2);
}

用for循环10000万次,得到的0和1大致相当,可以得出获得0和1的概率为0.5。但之后我就遇到了麻烦,我写了一个方法去实现RANDOM(a, b),例如RANDOM(0, 3),得到的结果是:

0有8335个

1有825个

2有42个

3有798个

我的算法是

将b-a+1扩展到2的最小幂级数,如果是个数为5,则取8(2^3),如果为16,则取16(2^4),然后用分治算法获取a与b之间的数,其中需要将大于b的数去除掉,重新获取。

我原本以为我写RANDOM(a, b)的算法错了。后来又写了一个算法,是网上很多人使用的算法,是将随机产生的0和1拼成2进制数,然后转换为十进制数,在一个区间内在有效,超过这个区间则排除重取。

用这个算法得到的结果与第一种算法结果相同。我只好把第二种算法的二进制数打印出来查找原因,发现一个问题,就是0或1连续出现的概率要比0和1交叉出现的概率大,我想既然是随机产生0和1,那这两个生成的概率应该相同才对。

因此我得出结论,使用Random.nextInt(0, 1)获取随机数的概率并不随机,原因是其生成连续相同0或1的概率与生成交叉0和1的概率不等,并且前者大于后者,尽管单独获取0和1的个数比相当,换句话说,用这种方法获取0和1的事件不独立。

验证如下

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
//检测Random.nextInt(2),连续获取两位0和1随机数
public int randomBaseS() {
 String s = new String(new StringBuffer().append(getBoolean()).append(getBoolean()));
 
 if("00".equals(s)){
  return 0;
 }else if("01".equals(s)){
  return 1;
 }else if("10".equals(s)){
  return 2;
 }else{
  return 3;
 }
}
//获取随机数二进制字符串
public String getBoolean(){
 return new String(new Integer(randomBase0()).toString());
}

使用for循环10000次,得到的计数结果如下:

"00"有4145个

"01"有928个

"10"有905个

"11"有4022个

那哪种算法能满足要求呢?如下:

?
1
2
3
4
5
//用Math.random()获取0,1随机数
//获取概率均为0.5,且随机
public int randomBase() {
 return Math.random()>0.5?1:0;
}

以上面的方法为基础,用for循环获取[0, 3]之间的整数,得到的结果如下:

0有2525个

1有2551个

2有2433个

3有2491个

满足要求,哈哈!

以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。

原文链接:https://loong.blog.csdn.net/article/details/51853522