Pandas的read_excel可以指定读取的列:
import pandas as pd
import numpy as np
file_loc = "path.xlsx"
df = pd.read_excel(file_loc, index_col=None, na_values=['NA'], parse_cols = "A,C:AA")
print(df)
parse_cols的值可以是:int,list,string和None,默认为None。
- None:如果为None则读取excel所有的列
- int:整数表示读取最后几列
- list:如果是一个整数列表,那么就是指定的序号的列会被读取
- string:按列名读取,如“A:E” or “A,C,E:F”
详情参考:http://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.read_excel.html