利用python数据分析panda学习笔记之DataFrame

时间:2022-02-08 06:41:33

2 DataFrame

  a:通过传入一个等长的列表构成DataFrame 自动加上索引

1 data={'state':['ohio','ohio','ohio','Nevada','Nevada'],
2 'year':[2000,2001,2002,2001,2002],
3 'pop':[1.5,1.7,3.6,2.1,2.9]}
4 frame=DataFrame(data)

利用python数据分析panda学习笔记之DataFrame

利用python数据分析panda学习笔记之DataFrame

  b:指定顺序序列(之前是按照默认排序)

1 DataFrame(data,columns=['year','state','pop'])

利用python数据分析panda学习笔记之DataFrame

  c:传入数据的时候列不存在 那么就是NAN

利用python数据分析panda学习笔记之DataFrame

  d:从DataFrame中获取一个series

1 frame2.year

利用python数据分析panda学习笔记之DataFrame

  e:赋值方式修改列

1 frame2['debt']=16.5
2 frame2

利用python数据分析panda学习笔记之DataFrame

  f:赋值的时候如果传入一个Series,那么可以进行精确的匹配,空位为缺省值

1 var = Series([-1.2,-1.5,-1.7],index=['two','four','five'])
2 frame2['debt']=var
3 frame2

利用python数据分析panda学习笔记之DataFrame

  g:为不存在列进行赋值,那么会创建一个新的列。删除用del

1 #为不存在的列进行赋值 那么会创建一个新列
2 frame2['eastern']=frame2.state=='ohio'
3 frame2
4
5 #删除列
6 del frame2['eastern']

利用python数据分析panda学习笔记之DataFrame

利用python数据分析panda学习笔记之DataFrame

2 传入的是字典的字典--->外层字典键作为列,内层键作为行索引,此时内层字典的键会被合并

1 #传入的是字典的字典
2 pop={'Nevada':{2001:2.4,2002:2.9},
3 'ohio':{2000:1.5,2001:1.7,2002:3.6}}
4 frame3=DataFrame(pop)

利用python数据分析panda学习笔记之DataFrame

  a:进行装置 --->frame3.T

  b:如果设置了Dataframe的index和columns的name属性 这些会被显示出来

1 #如果设置了Dataframe的index和columns的name属性 这些会被显示出来
2 frame3.index.name='year';
3 frame3.columns.name='state'
4 frame3

利用python数据分析panda学习笔记之DataFrame

  c:values会以二维ndarray返回---->frame3.values

利用python数据分析panda学习笔记之DataFrame

3 索引对象(续)