数据分析笔记--numpy和pandas的数据合并

时间:2024-03-27 22:27:25

import pandas as pd

import numpy as np

1.numpy的数据合并(concatenate,将两个ndarray合并为一个ndarray)

默认是进行列合并,通过指定axis=1可以对行进行合并

数据分析笔记--numpy和pandas的数据合并


2.Series的数据合并(concat)

1.当各个表的索引值没有重复的情况

默认是按列合并

数据分析笔记--numpy和pandas的数据合并

如果指定axis=1,进行按行合并的话,则会生成一个DataFrame对象,并且值那一列将会错开,缺失值填充为NaN

数据分析笔记--numpy和pandas的数据合并

2.当各个表的索引值发生重复

按列合并时,重复索引还是会出现,按行合并时,将会出现重复索引被共用的情况,无法被公用的索引还是会产生缺失值,填充为NaN值,默认合并时都是外连接,就是会显示所有的数据

数据分析笔记--numpy和pandas的数据合并

通过join参数可以指定内外连接(join="inner"或者join="outer")

数据分析笔记--numpy和pandas的数据合并


3.DataFrame的数据合并

默认合并还是按列合并,以外连接的形式,显示所有数据,修改axis=1可以改为按行合并,共有索引的数据被合并,缺失值填充为NaN,也可以通过join参数修改内外连接

数据分析笔记--numpy和pandas的数据合并