数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。
两张表:readerinformation.csv,readerrentrecode.csv
readerinformation.csv:
readerrentrecode.csv:
python" id="highlighter_783522">
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
|
# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('readerrentrecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd
df = pd.read_csv( 'readerrentrecode.csv' ) # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv( 'readerinformation.csv' )
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on = [ '读者证号' , '读者姓名' ], how = 'left' ) # pandas csv表左连接
data = data[[ '读者证号' , '读者姓名' , '读者性别' , '书名' , '中图法分类号' , '读者单位' , '读者类别' ]]
print data
print '------------------------------------------------------------------'
print
# -------------
# pandas写入表格数据
# -------------
data.to_csv(r 'data.csv' , encoding = 'gbk' )
|
合并后的csv文件:data.csv
通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。
以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/kevinelstri/article/details/55049179