Python数据写入csv格式文件

（只是传递，基础知识也是根基）

Python读取数据，并存入Excel打开的CSV格式文件内！

这里需要用到bs4，csv，codecs，os模块。

废话不多说，直接写代码！该重要的内容都已经注释了，剩下不懂的可以自己查询一下，或者QQ群内问我。QQ群在以往的博客中！

 #coding:utf-8

 from bs4 import BeautifulSoup

 import bs4

 import os

 import time

 import csv

 import codecs

 #读取XML内的文件数据并存入CSV格式的文件--可使用EXCEL打开

 def open_file():

     file_folder= 'C:\\Users\\Administrator\\Desktop\\File\\Filename' ##文件夹位置

     if os.path.isdir(file_folder):

         for fileName in os.listdir(file_folder):

            # print fileName

             info(fileName) ##读取文件名字

 def info(fileName):

     soup = bs4.BeautifulSoup(open('C:/Users/Administrator/Desktop/File/Filename/'+fileName))

     a = soup.find_all('mxxx')

     info = []

     for i in a:

         dt=[]

         dt.append(i.find('xx').get_text().strip())

         dt.append( i.find('xx').get_text().strip())

         dt.append(i.find('xx').get_text().strip())

         dt.append(i.find('xx').get_text().strip()+'\n')

         dt.append( i.find('xx').get_text().strip())

         dt.append(i.find('xx').get_text().strip())

         dt.append(float( i.find('xx').get_text().strip())  + float(i.find('xx').get_text().strip()))

         info.append(dt)

     with open("Ex_info.csv","ab+") as csvfile: ##“ ab+ ”去除空白行，又叫换行！

         csvfile.write(codecs.BOM_UTF8)  ##存入表内的文字格式

         writer = csv.writer(csvfile)  #存入表时所使用的格式

         writer.writerow(['表头','表头'])

         writer.writerows(info) #写入表

 if __name__ == '__main__':

     open_file()

这里主要三部分，我调用的测试使用的xml内的数据，这里使用的bs4来解析xml文件。

解释第一部分：

打开文件夹，并获取到文件的名字，因为文件有多个，所以使用了os模块的函数来打开文件

  file_folder= 'C:\\Users\\Administrator\\Desktop\\File\\Filename' ##文件夹位置

     if os.path.isdir(file_folder):

         for fileName in os.listdir(file_folder):

            # print fileName

             info(fileName) ##读取文件名字

fileName就是我们所获取的文件的名字。

第二部分：

获取文件名字后需要使用bs4模块来打开文件，因为多个文件，所以将解析过程写入函数内。

 def info(fileName):

     soup = bs4.BeautifulSoup(open('C:/Users/Administrator/Desktop/File/Filename/'+fileName))

     a = soup.find_all('mxxx')

     info = []

     for i in a:

         dt=[]

         dt.append(i.find('xx').get_text().strip())

         dt.append( i.find('xx').get_text().strip())

         dt.append(i.find('xx').get_text().strip())

         dt.append(i.find('xx').get_text().strip()+'\n')

         dt.append( i.find('xx').get_text().strip())

         dt.append(i.find('xx').get_text().strip())

         dt.append(float( i.find('xx').get_text().strip())  + float(i.find('xx').get_text().strip()))

         info.append(dt)

打开文件夹后取出文件，并解析后使用BeautifulSoup的解析网页方法来获取数据，'mxxx'与'xx'都是树的名字。

第三部分：

将数据写入csv文件，这里的数据都是List格式，并需要遍历。

 with open("Ex_info.csv","ab+") as csvfile: ##“ ab+ ”去除空白行，又叫换行！

         csvfile.write(codecs.BOM_UTF8)  ##存入表内的文字格式

         writer = csv.writer(csvfile)  #存入表时所使用的格式

         writer.writerow(['表头','表头','表头','表头'])

         writer.writerows(info) #写入表

这里的表头要和我们上面获取的数据列一致，不然会出现错误。写入文件的格式有 “ w ”," a+ "," ab+ "等，这里使用的是“ ab+ ”，去除空行！

还有我们如果存入的数据是1000000000这样的，在excel内是E+17的显示，所有在获取数据的时候最后面加 “\n”。最后写入表内，并打开！

秒客网

Python数据写入csv格式文件

相关文章