数据分析图片保存:vg
1.保存图片:plt.savefig(path)
2.图片格式:jpg,png,svg(建议使用,不失真)
3.数据存储格式: excle,csv
csv介绍
csv就是用逗号隔开的纯文本信息!!会以表格的信息打开
矩阵生成的相关属性
impor numpy as np #导入模块
a = np.array([1,2,3,4,5]) #一维矩阵
a = np.array([[1,2,3],[4,5,6]]) #二维矩阵
np.eye(3) #单位矩阵
np.diag(np.array([1,2,3,4])) #对角矩阵
a.size #矩阵的总数量
a.shape #矩阵的行列
a.ndim #矩阵的维度
a.dtype #矩阵的数据类型
矩阵的基本操作
#基本操作
import numpy as np
a = np.arange(1,10).reshape(3,3)
b = np.arange(11,20).reshape(3,3)
a+b/np.add(a,b)
a[a>5] #判断提出大于5的数据
a**2
#自带的数学函数
a.max() #最大值
a.min() #最小值
a.mean() #平均数
a.sum() #和
a.sum(axis=0\1)#每列\行的和
a.std() #标准差反应是数据和平均值的离散情况
a.sqrt() #平方根
np.where(a<80,0,90) #三目 如果小于80替换为0,否则替换成90
切片灵活操作数据 (重点)
#切片灵活操作数据
import numpy as np
a = np.arange(1,10).reshape(3,3)
"""
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
"""
a[:,1] #所有行的第二列数据 array([2, 5, 8])
a[:2,:2] #前两行的前两列数据array([[1, 2][4,5]])
a[0].max() #第一行的最大数据 3
a[0][1] #第一行的第二个数据 2
Numpy读文档
格式(一般不使用)
a = np.genfromtxt(path,delimiter=',',dtype=str,skip_header=1)
Ndarray和list的区别
Ndarray创建时有固定的大小(list可动态增加)
Ndarray元素都具有相同的数据类型
Ndarray内置大量的数学函数可进行高等数学相关操作(高效)
-
Ndarray支持矢量化(向量化)--简洁,高效,更接近标准数学
比如:二维list每个元素相乘,需要双层循环
a+b ===>矩阵自动实现每个对应元素相加
列表 a +b ===> 列表连接
算法汇总
np.std()标准差 --------->反应与平均值的离散情况
-
正态分布:
也叫钟行图,高斯分布
反应是集中的分布趋势,峰值周围是分布数据量最多的
np.random.randn(3,3)测试的符合正太分布的数据
反应的现实情况,种群智力水平,身高,体重,医学领域.
-
点阵积:dot()
待讲................