数据规整化:清理、转换、合并、重塑
合并数据集
pandas.merge
pandas.concat
combine_first
数据库风格的DataFrame合并
索引上的合并
join()实例方法
轴向连接
NumPy中有concatenation
pandas中concat()
合并重叠数据
NumPy中的where()
pandas中的combine_first
重塑和轴向旋转
重塑层次化索引
stack() 列到行
unstack() 行到列
将长格式旋转为宽格式
不懂
数据转换
移除重复数据
DataFrame的duplicated()方法
drop_duplicates()
利用函数或映射进行数据转换
Series的map()方法
替换值
replace()
重命名轴索引
rename()
离散化和面元划分
pandas的cut()
检测和过滤异常值
布尔型DataFrame和any()
排列和随机采样
利用numpy.random.permutation()函数
计算指标/哑变量
pandas中的get_dummies()
字符串操作
字符串对象方法
split()和strip()
join()
检测子串 in和index,find
count()
replace()