使用python中的pandas,xlrd,openpyxl库完成合并excel中指定sheet的操作
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
|
# -*- coding: UTF-8 -*-
import xlrd
import pandas as pd
from pandas import DataFrame
from openpyxl import load_workbook
#表格位置
excel_name = '1.xlsx'
# 获取workbook中所有的表格
wb = xlrd.open_workbook(excel_name)
#获取sheets
sheets = wb.sheet_names()
# 循环所需sheet
newdata = DataFrame()
#in后()里填写需要合并的sheet页数
for i in ( 3 , 4 , 5 ):
df = pd.read_excel(excel_name, sheet_name = (i - 1 ), header = None ,index_col = 0 ,encoding = 'utf-8' )
newdata = newdata.append(df,ignore_index = False )
#保存为新的sheet,首先新建sheet,合并后的数据保存到新sheet中
writer = pd.ExcelWriter( '1.xlsx' ,engin = 'openpyxl' )
book = load_workbook(writer.path)
writer.book = book
#利用dataframe.to_excel保存合并后的数据到新的sheet,生成新的sheet命名为newdata
newdata.to_excel(excel_writer = writer,sheet_name = "newdata" )
writer.save()
writer.close()
print ( '处理完成!' )
|
其中
1
|
df = pd.read_excel(excel_name, sheet_name = (i - 1 ), header = None ,index_col = 0 ,encoding = 'utf-8' )
|
需要指定 header = None,否则会出现如下warning:
FutureWarning: Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.
并且生成的新sheet中的列会出现乱序以及Unnamed列。
补充:pandas 中读取和写入csv文件时候出现Unnamed:0的解决方案
在读取csv文件的时候,默认会自动添加新的一列,Unnamed:0
解决方案:
read_csv()时候,设置index_col=0即可。
在写入csv文件的时候,默认会自动加入新的一列,Unnamed:0
解决方案:
to_csv()时候,设置index=False。或者加上index=True, index_label="id"
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/qq_31824879/article/details/88667101