《利用Python进行数据分析》第7章学习笔记

时间:2021-12-18 17:28:33

数据规整化:清理、转换、合并、重塑

合并数据集

pandas.merge

pandas.concat

combine_first

数据库风格的DataFrame合并

《利用Python进行数据分析》第7章学习笔记

《利用Python进行数据分析》第7章学习笔记

索引上的合并

join()实例方法

轴向连接

NumPy中有concatenation

pandas中concat()

《利用Python进行数据分析》第7章学习笔记

合并重叠数据

NumPy中的where()

pandas中的combine_first

重塑和轴向旋转

重塑层次化索引

stack() 列到行

unstack() 行到列

将长格式旋转为宽格式

不懂

数据转换

移除重复数据

DataFrame的duplicated()方法

drop_duplicates()

利用函数或映射进行数据转换

Series的map()方法

替换值

replace()

重命名轴索引

rename()

离散化和面元划分

pandas的cut()

检测和过滤异常值

布尔型DataFrame和any()

排列和随机采样

利用numpy.random.permutation()函数

计算指标/哑变量

pandas中的get_dummies()

字符串操作

字符串对象方法

split()和strip()

join()

检测子串 in和index,find

count()

replace()

《利用Python进行数据分析》第7章学习笔记

《利用Python进行数据分析》第7章学习笔记

正则表达式

《利用Python进行数据分析》第7章学习笔记

pandas中矢量化的字符串函数

《利用Python进行数据分析》第7章学习笔记