摘要:不同方法读取excel中的多个不同sheet表格性能比较

# 方法1
def read_excel(path):
  df=pd.read_excel(path,None)
  print(df.keys())
  # for k,v in df.items():
  #   print(k)
  #   print(v)
  #   print(type(v))
  return df
 
# 方法2
def read_excel1(path):
  data_xls = pd.ExcelFile(path)
  print(data_xls.sheet_names)
  data={}
  for name in data_xls.sheet_names:
    df=data_xls.parse(sheetname=name,header=None)
    data[name]=df
    # print(df)
    # print(name)
  return data
 
# 方法3
def read_excel2(path):
  data_xls = pd.io.excel.ExcelFile(path)
  data={}
  print(data_xls.sheet_names)
  for name in data_xls.sheet_names:
    df=pd.read_excel(data_xls,sheetname=name,header=None)
    data[name]=df
  return data
 

运行结果

结论:若读取多个sheet表格时,方法2和方法3相对于方法1的效率较高。

需要解决的问题:

方法1的解析结果

方法2的解析结果

方法3的解析结果