爬虫实践——数据存储到Excel中

时间:2022-10-27 16:50:01

在进行爬虫实践时,我已经爬取到了我需要的信息,那么最后一个问题就是如何把我所爬到的数据存储到Excel中去,这是我没有学习过的知识。

如何解决这个问题,我选择先百度查找如何解决这个问题。

百度查到的方法千万种,我先选择看得懂的文章下手,不断尝试,最后解决了问题

那么到底如何解决这个问题呢?

解决这个问题要用到三个模块分别是xlwt、xlrd和xlutils

在使用这两个模块时要先下载安装它们,我用的是pycharm编写程序,我用到的安装方法是:

#在文件中导入xlwt、xlrd 和xlutils

import  xlwt

import xlrd

import xlutils

再写入它们之后,会报错,把鼠标分别移到xlwt上点击一下,

它的头上会有一个红色的小灯泡,点击灯泡再点击install and import package "xlwt"

xlrd和xlutils同理

这样这三个模块就安装好了

模块安装好了,下一步就是要学会如何使用这三个模块了

xlwt模块:

 import xlwt

 file_name = r'C:\Users\樱花雨\Desktop\test.xls'#这是你要保存文件的文件路径和文件名
workbook = xlwt.Workbook()#表示新建xls工作簿
sheet1 = workbook.add_sheet('worksheet')#新建xls表,表的名字是worksheet
for a in range(1,16):
# 把数据写入xls中,行,列,值
sheet1.write(0, 0, 'I')
sheet1.write(0, 1, 'love')
sheet1.write(0.2, 'python')
# 保存xls到file_name的路径下和文件名
workbook.save(file_name)

xlrd和xlutils模块:(xlrd参考链接:xlrd)

 import xlrd
from xlutils.copy import copy xlsfile = r'C:\Users\樱花雨\Desktop\test.xls'
#打开xsl文件
book = xlrd.open_workbook(xlsfile)
#获取表格的名字
sheet_name = book.sheet_names()
print(sheet_name)
#获取工作表
#(1)通过索引顺序获取
#sheet = bool.sheets()[0]
#(2)通过名称获取
#sheet = book.sheet_by_name(r'worksheet')
#(3)通过索引顺序获取
sheet = book.sheet_by_index(0)
#获取表中的行数
nrows = sheet.nrows
#获取表中的列数
ncols = sheet.ncols
print(nrows)
print(ncols)
#获取表中整行的内容
row_data = sheet.row_values(0)
#获取表中列内容
col_data = sheet.col_values(0)
print(row_data)
print(col_data)
#获取表中单元格的内容
cell_value = sheet.cell_value(3,0)
print(cell_value)
#获取表中单元格的内容
cell_value2 = sheet.cell(3,0)
print(cell_value2)
#修改或添加单元格内容
#ctype:0 empty ;1,string;2 number;3 date;4 boolean;5 error
#value:写入单元格中的内容
#xf:0
#sheet.put_cell(row,col,ctype,value,xf)
sheet.put_cell(1,2,1,"test",0)
cell_value2 = sheet.cell(1,1)
print(cell_value2)
#保存xlsfile
wb = copy(book)
wb.save(xlsfile)