python每日学习12:pandas库的用法(1)

时间:2025-02-23 08:36:43

DataFrame对象创建

  • 是 Pandas 中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等)
  • DataFrame 即有行索引也有列索引,可以被看做是由 Series 组成的字典。将两个series对象作为dict的value传入,就可以创建一个DataFrame对象。
# 创建DataFrame对象
a_dict={'aa':3000,'bb':5000,'cc':6000}
b_dict={'dd':120,'ee':350,'ff':670}
a=pd.Series(a_dict)
b=pd.Series(b_dict)
c=pd.DataFrame({'aa':a,'bb':b})
c

# values index columns属性
c.index#索引
c.values#值
c.columns#列的名称

# 列表创建
a_dict={'aa':3000,'bb':5000,'cc':6000}
b_dict={'aa':120,'bb':350,'cc':670}
a=pd.DataFrame([a_dict,b_dict])
a=pd.DataFrame([a_dict,b_dict],index=['value1','value2'])

# 索引columns的使用
a_dict={'aa':3000,'bb':5000,'cc':6000}
a=pd.Series(a_dict)
pd.DataFrame(a,columns=['named'])

# 二维数组指定columns和index创建
pd.DataFrame(np.random.randint(0,10,(3,2)),columns=list('ab'),index=list('efg'))

# Pandas中的Index:Pandas中的Index,其实是不可变的一维数组
ind=pd.Index([2,3,4,5,6])
ind[3]
ind[::2]
#有ndim shap dtype size属性
#但不能进行修改