import pandas as pd
import numpy as np
1.numpy的数据合并(concatenate,将两个ndarray合并为一个ndarray)
默认是进行列合并,通过指定axis=1可以对行进行合并
2.Series的数据合并(concat)
1.当各个表的索引值没有重复的情况
默认是按列合并
如果指定axis=1,进行按行合并的话,则会生成一个DataFrame对象,并且值那一列将会错开,缺失值填充为NaN
2.当各个表的索引值发生重复
按列合并时,重复索引还是会出现,按行合并时,将会出现重复索引被共用的情况,无法被公用的索引还是会产生缺失值,填充为NaN值,默认合并时都是外连接,就是会显示所有的数据
通过join参数可以指定内外连接(join="inner"或者join="outer")
3.DataFrame的数据合并
默认合并还是按列合并,以外连接的形式,显示所有数据,修改axis=1可以改为按行合并,共有索引的数据被合并,缺失值填充为NaN,也可以通过join参数修改内外连接