python读取word文件里的表格。

时间:2024-03-27 18:42:13

因为power bi desktop支持了python.借用了python将word文件里的表格读取到power bi里面。

python这部分的代码如下。说明一下:用了docx库,这个库不支持doc的格式。:

from docx import Document
import pandas as pd
res=[]
#docx库不支持doc格式
def read_table(docpath:str,n:int):
    '''docpath->word文件路径
    n->要读取文件中的第几个表格。从0开始
    返回表格数据的列表
    '''
    global res
    doc=Document(docpath)
    tb=doc.tables[n]
    for i in range(4,len(tb.rows)):
        data=[]
        row_cells=tb.rows[i].cells
        for  cell in row_cells:
            data.append(cell.text)
        res.append(data)
    return res
word_data=read_table('D:/Python/数据表.docx',0)
df=pd.DataFrame(res)

python这部分代码可以直接在python里面使用。power bi里也是写完脚本确定后bi会自动将dataframe传递到数据表。结果如下图:

python读取word文件里的表格。