在我们使用一些数据的过程中,我们想要打乱数组内数据的顺序但不改变数据本身,可以通过改变索引值来实现,也就是将索引值重新随机排列,然后生成新的数组。功能主要由python中random模块的sample()函数实现。
1
2
|
sample(population, k) method of random.random instance
chooses k unique random elements from a population sequence or set .
|
下面的代码实现的是打乱iris数据,iris数据是网上下载的csv格式文件,相信大家不陌生的了,原始数据是三种鸢尾(iris)顺序排列的,三种花分别是:setosa,versicolor 和 virginica ,记录的数据有sepallengthcm(花萼长度), sepalwidthcm(花萼宽度), petallengthcm(花瓣长度), petalwidthcm (花瓣宽度)
在做聚类分析的时候曾经用到过iris数据,当然,如果安装了scikit learn 模块的话,可以通过
1
2
|
from sklearn import datasets
iris = datasets.load_iris()
|
获取
参考链接:http://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html
下面的程序实现打乱iris的数据顺序:
1
2
3
4
5
6
7
8
9
10
11
|
import pandas as pd
import random as rd # 导入random模块,使用里面的sample函数
from pylab import *
iris = pd.read_csv( 'd:\\iris.csv' )
a1 = reshape(iris[ 'id' ],[ 150 , 1 ])
a2 = reshape(iris[ 'sepallengthcm' ],[ 150 , 1 ])
a3 = reshape(iris[ 'sepalwidthcm' ],[ 150 , 1 ])
data = c_[a1,a2,a3]
idx = rd.sample( range ( 150 ), 150 )
iris = data[idx] # 打乱顺序,这里只选取了花萼长度和宽度这两个特征值
|
2017/7/10 updated
打乱顺序的方法还可以使用random.shuffle(iterable),这样会直接改变iterable的顺序,shuffle 是洗牌的意思,顾名思义,需要注意的是random.shufle()函数没有返回值,如果写成
1
|
mylist = random.shuffle(list1)
|
将不会得到任何结果
以上这篇对python random模块打乱数组顺序的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/ouening/article/details/55254984