Python数据分析Numpy库方法简介(二)

时间:2022-10-01 21:32:17

数据分析图片保存:vg

  1.保存图片:plt.savefig(path)

  2.图片格式:jpg,png,svg(建议使用,不失真)

  3.数据存储格式: excle,csv

csv介绍

  csv就是用逗号隔开的纯文本信息!!会以表格的信息打开

矩阵生成的相关属性

    

  impor numpy as np #导入模块

  a = np.array([1,2,3,4,5]) #一维矩阵
  a = np.array([[1,2,3],[4,5,6]]) #二维矩阵
  np.eye(3) #单位矩阵
  np.diag(np.array([1,2,3,4])) #对角矩阵
  a.size #矩阵的总数量
  a.shape #矩阵的行列
  a.ndim #矩阵的维度
  a.dtype #矩阵的数据类型

矩阵的基本操作

      

  #基本操作
  import numpy as np
  a = np.arange(1,10).reshape(3,3)
  b = np.arange(11,20).reshape(3,3)
  a+b/np.add(a,b)
  a[a>5] #判断提出大于5的数据
  a**2
  #自带的数学函数
  a.max() #最大值
  a.min() #最小值
  a.mean() #平均数
  a.sum() #和
  a.sum(axis=0\1)#每列\行的和
  a.std() #标准差反应是数据和平均值的离散情况
  a.sqrt() #平方根
  np.where(a<80,0,90) #三目 如果小于80替换为0,否则替换成90

切片灵活操作数据 (重点) 

  #切片灵活操作数据
  import numpy as np
  a = np.arange(1,10).reshape(3,3)
  """
  array([[1, 2, 3],
  [4, 5, 6],
    [7, 8, 9]])
  """
  a[:,1] #所有行的第二列数据 array([2, 5, 8])
  a[:2,:2] #前两行的前两列数据array([[1, 2][4,5]])
  a[0].max() #第一行的最大数据 3
  a[0][1] #第一行的第二个数据 2

Numpy读文档

格式(一般不使用)
  • a = np.genfromtxt(path,delimiter=',',dtype=str,skip_header=1)

Ndarray和list的区别

  • Ndarray创建时有固定的大小(list可动态增加)

  • Ndarray元素都具有相同的数据类型

  • Ndarray内置大量的数学函数可进行高等数学相关操作(高效)

  • Ndarray支持矢量化(向量化)--简洁,高效,更接近标准数学

    • 比如:二维list每个元素相乘,需要双层循环

    • a+b ===>矩阵自动实现每个对应元素相加

    • 列表 a +b ===> 列表连接

算法汇总

  1. np.std()标准差 --------->反应与平均值的离散情况

  2. 正态分布:

    • 也叫钟行图,高斯分布

    • 反应是集中的分布趋势,峰值周围是分布数据量最多的

    • np.random.randn(3,3)测试的符合正太分布的数据

    • 反应的现实情况,种群智力水平,身高,体重,医学领域.

  3. 点阵积:dot()

    • 待讲................