【学习总结】GirlsInAI ML-diary 总
原博github链接-day18
使用Python来操作excel文件
- Excel的处理与DataFrame格式是分不开的
- 可以理解为DataFrame就是Excel在python里的一种表现形式
1-创建并保存excel
打开jupyter notebook,创建一个dataframe
查看当前文件路径
把df保存在相同路径下时,使用to_excel,括号内是保存为的文件名
报错
试试CSDN看到的方法: cmd -- pip install openpyxl切换路径保存
2-读取/改写excel
使用pandas包的read_excel()函数,括号内写上想读取的excel名
报错:缺少xlrd包,同上安装后可读取新读取进Python里的excel虽然和之前的df长的一样,但是已经是两个表格了(存放在不同的变量名中所以是两个?)
改写df2:
路径不变,再次保存,如果文件名也不变,将覆盖原excel文件
读写csv
- 除了excel,DataFrame还可以保存为csv文件
csv文件是一个非常常见并且非常重要的表格格式,与'.xlsx'差不多
to_csv()
- 将df保存为csv格式read_csv()
- 读取csv文件- csv读取的df多个一列unnamed: 0
用list(df)来检查列名:确实变为5列,把index索引那一列也弄成一列了
删掉没用的那一列
总结:缺什么补什么
- 保存excel文件需要
openpyxl
包 - 读取excel文件需要
xlrd
包 - 缺少的包:cmd--pip install xx