Pandas数据存取

时间:2023-03-10 02:18:59
Pandas数据存取

pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA'])

Pandas数据存取
Pandas可以存取多种介质类型数据,例如:内存、文本、CSV、JSON、HTML、Excel、HDF5、SQL等 生成数据 import numpy as np
import pandas as pd df = pd.DataFrame(np.random.randn(1000, 4),columns=['A', 'B', 'C', 'D']) df

Pandas存取CSV

写入CSV

df.to_csv('foo.csv')

df.to_csv('foo.csv',index=False) #不保存行索引

读取CSV

pd.read_csv('foo.csv')

读取CSV其他参数

pd.read_csv(
'aaa.csv', #文件名
usecols=[0,1,2,4], #读取指定列
nrows=10, #读取前几行
encoding='GBK' #编码,根据文本编码修改,默认utf-8,可以指定为GBK
) '''
data,time,name,age
20100101,000000,"张三",18
20100101,230000,"李,四",28
''' x = pd.read_csv(
'aaa.csv',
parse_dates={'timestamp': ['data','time']}, #将两列合并解析为时间格式
index_col='timestamp' #将时间设为行索引
)
  • csv文件内有汉字等特殊符号时,csv文件编码应为utf-8(无BOM)可默认正常读取,如果编码是ANSI,加参数encoding='GBK'
  • 数据内有逗号时,左右加英文半角双引号,可以正常解析

Pandas存取HDF5

写入HDF5

df.to_hdf('foo.h5','df')

从HDF5读取

pd.read_hdf('foo.h5','df')

Pandas存取Excel(xlsx)

写入Excel文件

df.to_excel('foo.xlsx', sheet_name='Sheet1')

从Excel文件读取