Pandas包对数据的常用探索功能,方便了解数据描述性属性。
目录
-
基础属性
- shape
- indexs
- columns
- values
- dtype/dtypes
-
汇总和计算描述统计
- count()
- value_count()
- describe()
- head()
- tail()
Pandas数据格式
- Series
- DataFrame:每个column就是一个Series
基础属性
-
shape
- 返回行列数
- index
- columns
- values
- dtype/dtypes
汇总和计算描述统计
- count()
-
value_counts()
- 统计Series各值数量
# 默认 sort = True
s.value_counts()
pd.value_counts(s,sort=False)
-
describe()
df.describe()
A | B | C | D | |
---|---|---|---|---|
count | 6.000000 | 6.000000 | 6.000000 | 6.000000 |
mean | -0.465925 | -0.146798 | 0.005445 | -0.756245 |
std | 0.841877 | 0.238644 | 1.389317 | 1.471563 |
min | -1.587605 | -0.456638 | -2.072448 | -2.840490 |
25% | -0.786075 | -0.306717 | -0.649605 | -1.528442 |
50% | -0.729990 | -0.144521 | -0.021415 | -0.816773 |
75% | 0.090604 | 0.035111 | 0.848559 | 0.157414 |
max | 0.692672 | 0.130688 | 1.868398 | 1.220088 |
- head()
- tail()