利用python进行数据分析1_numpy的基本操作，建模基础

import numpy as np
# 生成指定维度的随机多维数据
data=np.random.rand(2,3)
print(data)
print(type(data))

结果：

[[0.11959428 0.52816495 0.31736705]
 [0.75400637 0.26683732 0.54080784]]
<class 'numpy.ndarray'>

View Code

print('维度个数',data.ndim)
print('各维度大小',data.shape)
print('数据类型',data.dtype)

结果：

维度个数 2
各维度大小 (2, 3)
数据类型 float64

View Code

补充：

import numpy as np
# 生成指定维度的随机多维数据
data2=np.arange(1,10,2)#间隔为2
print(data2)
print('元素个数',data2.size)   # 5

ndarray，N维数组对象（矩阵）

所有元素必须是相同类型 ndim属性：维度个数 shape属性：各维度大小 dtype属性：数据类型

创建ndarray

#list转换为ndarray
l=range(10)
data=np.array(l)
print(data)#[0 1 2 3 4 5 6 7 8 9]
print(data.shape)#(10,)
print(data.ndim)#1

#嵌套序列转换为ndarray
l2=[range(10),range(10)]
data=np.array(l2)
print(data.shape)#(2,10)

print(data)
#[[0 1 2 3 4 5 6 7 8 9]
 #[0 1 2 3 4 5 6 7 8 9]]

np.zeros,Np.ones和np.empty

#np.zeros
np.zeros((3,4))

#array([[0., 0., 0., 0.],
#        [0., 0., 0., 0.],
#        [0., 0., 0., 0.]])

#np.ones
np.ones((2,3)) 

# array([[1., 1., 1.],
#        [1., 1., 1.]])

#np.empty
np.empty((3,3))

# array([[3.8043055e-322, 0.0000000e+000, 0.0000000e+000],
#        [0.0000000e+000, 0.0000000e+000, 3.6560858e-321],
#        [0.0000000e+000, 0.0000000e+000, 2.5706196e-316]])

#np.empty 指定数据类型
empty_int_arr=np.empty((3,3),int)
empty_int_arr

# array([[  45023345,          0, -301822228],
#        [       127, -534188352,       2046],
#        [        36,          0,          2]])

总结： np.zeros,Np.ones和np.empty指定大小的全0或全1数组注意：第一个参数是元祖，用来指定大小(3,4)。empty不是总是返回全0，有时返回的是未初始的随机值。

np.eye(2,3)#2*3单位矩阵
# array([[1., 0., 0.],
#        [0., 1., 0.]])

np.eye(3)#3*3单位矩阵
# [[1. 0. 0.]
#  [0. 1. 0.]
#  [0. 0. 1.]]

#np.arange()
# 类似range()，注意是arange，不是英文arrange
print(np.arange(10))#[0 1 2 3 4 5 6 7 8 9]

zeros_float_arr=np.zeros((3,4),dtype=np.float64)
print(zeros_float_arr.dtype)#float64
print(zeros_float_arr)
# [[0. 0. 0. 0.]
#  [0. 0. 0. 0.]
#  [0. 0. 0. 0.]]

zeros_int_arr=zeros_float_arr.astype(np.int32)
print(zeros_int_arr.dtype)#int32
print(zeros_int_arr)
# [[0 0 0 0]
#  [0 0 0 0]
#  [0 0 0 0]]

矢量与矢量运算

arr=np.array([[1,2,3],
              [4,5,6]])
#元素相乘
print(arr*arr)
# [[ 1  4  9]
#  [16 25 36]]

# 矩阵相加
print(arr+arr)
# [[ 2  4  6]
#  [ 8 10 12]]

print(1./arr)
# [[1.         0.5        0.33333333]
#  [0.25       0.2        0.16666667]]

print(2.*arr)
# [[ 2.  4.  6.]
#  [ 8. 10. 12.]]

#一维数组
arr1=np.arange(10)
print(arr1)#[0 1 2 3 4 5 6 7 8 9]
print(arr1[2:5])#[2 3 4]

#多维数组
arr2=np.arange(12).reshape(3,4)
arr2
# array([[ 0,  1,  2,  3],
#        [ 4,  5,  6,  7],
#        [ 8,  9, 10, 11]])

arr2[1]#array([4, 5, 6, 7])

arr2[0:2,2:]
# array([[2, 3],
#        [6, 7]])

import numpy as np
a=np.array([[1,2,3],[4,5,6]])
print(a)
# [[1 2 3]
#  [4 5 6]]
print(a[1][0],a[1,0])#索引结果相同，均为第一行第零列元素 4

#条件索引
#找出data_arr中2015年后的数据
data_arr=np.random.rand(3,3)
print(data_arr)
# [[0.74277876 0.03168798 0.60155076]
#  [0.06961099 0.4674936  0.61162942]
#  [0.23676798 0.40399878 0.80521454]]

year_arr=np.array([[2000,2001,2000],
                   [2005,2002,2009],
                   [2001,2003,2010]])
filtered_arr=data_arr[year_arr>=2005]
print('索引后的数据：',filtered_arr)#索引后的数据： [0.06961099 0.61162942 0.80521454]

#多个条件
#多个条件的组合要使用& | ,而不是and or
filtered_arr=data_arr[(year_arr<=2005)&(year_arr%2==0)]
print('索引后的数据：',filtered_arr)#索引后的数据： [0.74277876 0.60155076 0.4674936]

转置：

arr=np.random.rand(2,3)
print(arr)
# [[0.61150182 0.22558736 0.37966609]
#  [0.18998577 0.86658851 0.93381798]]

print(arr.transpose())#同print(arr.T)
print(arr.T)
# [[0.61150182 0.18998577]
#  [0.22558736 0.86658851]
#  [0.37966609 0.93381798]]