java random.nextInt的坑
下面的代码
1
2
|
Random random = new Random();
Integer code = random.nextInt(len);
|
很简单的两句代码,需要注意两点
第一:nextInt的取值是[0,n) ,不包括n。如果是随机list,直接传list的size,不用担心下标越界。
api说明:
Returns a pseudorandom, uniformly distributed int value between 0 (inclusive) and the specified value (exclusive)
第二个:nextInt在数据量小的时候,重复概率比较高。比如现在有一个大小为6的list,我希望随机显示4条且不重复。正确的做法是每次得到随机数后,移除下标对于的对象。这样即使random重复了也没关系,因为下标对应数据移除后,同样的下标对应的对象是不一样的。
千万别像我之前的做法,遍历list,然后随机取到下标后,再去重。这样有时能得到4个,有时得不到。比如下标会出现 5,1,1,1,2,1.这样的话,最终list只会有三个。
之前一直没有怀疑是这段代码的问题,怀疑接口不稳定或者是数据不完整之类的。查日志还一直在看接口传递参数和返回参数,结果是因为对nextInt理解不深刻,在我印象中感觉randomInt是随机数且不重复的,不过事实证明我想多了。
java random.nextInt()不随机性
最近在研究算法,也写一些小程序,其中有一个是《算法导论》中的习题:描述RANDOM(a, b)过程的一种实现,它只调用RANDOM(0, 1),作为a和b的函数,你的程序的期望时间运行时间是多少?
这个题在网上已经有很多人给出了答案
我也自己写了一个算法,不过本文的主题不是针对这个问题,而是RANDOM(0, 1)的实现方法。我刚开始使用的是random.nextInt(0, 1)来取随机的0和1,也测试了其“随机性”,代码如下:
1
2
3
4
5
6
|
//用Random.nextInt(2)获取0,1随机数
//获取概率均为0.5,但不随机
public int randomBase0() {
Random r = new Random();
return r.nextInt( 2 );
}
|
用for循环10000万次,得到的0和1大致相当,可以得出获得0和1的概率为0.5。但之后我就遇到了麻烦,我写了一个方法去实现RANDOM(a, b),例如RANDOM(0, 3),得到的结果是:
0有8335个
1有825个
2有42个
3有798个
我的算法是
将b-a+1扩展到2的最小幂级数,如果是个数为5,则取8(2^3),如果为16,则取16(2^4),然后用分治算法获取a与b之间的数,其中需要将大于b的数去除掉,重新获取。
我原本以为我写RANDOM(a, b)的算法错了。后来又写了一个算法,是网上很多人使用的算法,是将随机产生的0和1拼成2进制数,然后转换为十进制数,在一个区间内在有效,超过这个区间则排除重取。
用这个算法得到的结果与第一种算法结果相同。我只好把第二种算法的二进制数打印出来查找原因,发现一个问题,就是0或1连续出现的概率要比0和1交叉出现的概率大,我想既然是随机产生0和1,那这两个生成的概率应该相同才对。
因此我得出结论,使用Random.nextInt(0, 1)获取随机数的概率并不随机,原因是其生成连续相同0或1的概率与生成交叉0和1的概率不等,并且前者大于后者,尽管单独获取0和1的个数比相当,换句话说,用这种方法获取0和1的事件不独立。
验证如下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
//检测Random.nextInt(2),连续获取两位0和1随机数
public int randomBaseS() {
String s = new String( new StringBuffer().append(getBoolean()).append(getBoolean()));
if ( "00" .equals(s)){
return 0 ;
} else if ( "01" .equals(s)){
return 1 ;
} else if ( "10" .equals(s)){
return 2 ;
} else {
return 3 ;
}
}
//获取随机数二进制字符串
public String getBoolean(){
return new String( new Integer(randomBase0()).toString());
}
|
使用for循环10000次,得到的计数结果如下:
"00"有4145个
"01"有928个
"10"有905个
"11"有4022个
那哪种算法能满足要求呢?如下:
1
2
3
4
5
|
//用Math.random()获取0,1随机数
//获取概率均为0.5,且随机
public int randomBase() {
return Math.random()> 0.5 ? 1 : 0 ;
}
|
以上面的方法为基础,用for循环获取[0, 3]之间的整数,得到的结果如下:
0有2525个
1有2551个
2有2433个
3有2491个
满足要求,哈哈!
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://loong.blog.csdn.net/article/details/51853522