缘由:
为完成伪造导入大量应用评论,需取到0-10分的随机评论分数值,插入数据集合,且保持整体数据的平均值(期望)与之前基本不变。
/**
* 得到随机的评论分数
* @param avgScore
* @param max
* @param min
* @return
* @author
*/
public double getDisperseScore(Double avgScore,Double max,Double min){
//等概率区间大小
double region = (max-min)/2 - ((max-min)/2-avgScore);
if(()>0.5){
return avgScore+()*region;
}else{
return ()*region;
}
}
结果是出来了,但是发现原来评论分数平均分为5的应用有一些0分的评论。。有1/10的概率。。效果不理想。。
改进方案:缩小等概率区间的大小。
后期:正态分布也许能满足需求。关于如何由产生正态分布请继续关注 Vernon Blog