- python版本: 3.6
- pandas版本: 0.23.4
行索引
索引行有三种方法,分别是 loc iloc ix
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
import pandas as pd
import numpy as np
index = [ "a" , "b" , "c" , "d" ]
data = np.random.randint( 10 , size = ( 4 , 3 ))
df = pd.dataframe(data, index = index)
"""
0 1 2
a 9 7 1
b 0 0 7
c 2 6 5
d 8 2 5
"""
|
loc
loc通过行索引名字来确定行的
单行索引, 返回series对象
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
df.loc[ "a" ]
"""
0 9
1 7
2 1
name: a, dtype: int64
"""
df.loc[ "b" ]
"""
0 0
1 0
2 7
name: b, dtype: int64
"""
|
多行索引, 返回dataframe对象
1
2
3
4
5
6
|
df.loc[[ "a" , "c" ]]
"""
0 1 2
a 9 7 1
c 2 6 5
"""
|
iloc
通过行索引序号来确定行的
单行索引, 返回series对象
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
df.iloc[ 0 ]
"""
0 9
1 7
2 1
name: a, dtype: int64
"""
df.iloc[ 1 ]
"""
0 0
1 0
2 7
name: b, dtype: int64
"""
|
多行索引, 返回dataframe对象
1
2
3
4
5
6
|
df.iloc[[ 0 , 2 ]]
"""
0 1 2
a 9 7 1
c 2 6 5
"""
|
ix(不建议使用)
通过行索引名字或序号来确定行的, 如果行索引 index 的类型为整型时, 使用 ix 方法索引时为按行索引名字进行索引, 如行索引名不存在则会报错
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
|
index = [ 2 , 3 , 4 , 5 ]
df = pd.dataframe(data, index = index)
"""
0 1 2
2 9 7 1
3 0 0 7
4 2 6 5
5 8 2 5
"""
df.ix[ 2 ]
"""
0 9
1 7
2 1
name: 2, dtype: int64
"""
# 提示信息
"""
.ix is deprecated. please use
.loc for label based indexing or
.iloc for positional indexing
"""
# 如果 index 为整数, 则不能按行索引号进行索引
df.ix[ 0 ]
"""
...
keyerror: 0
"""
|
列索引
索引行有两种方法,分别是 . []
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
import pandas as pd
import numpy as np
columns = [ "i" , "ii" , "iii" ]
data = np.random.randint( 10 , size = ( 4 , 3 ))
df = pd.dataframe(data, columns = columns)
"""
i ii iii
0 4 5 9
1 0 3 4
2 7 9 1
3 8 2 3
"""
|
通过 . 属性直接获取指定行, 返回series对象
1
2
3
4
5
6
7
8
|
df.i
"""
0 4
1 0
2 7
3 8
name: i, dtype: int64
"""
|
[]
单列索引, 返回dataframe对象
1
2
3
4
5
6
7
8
|
df[[ "i" ]]
"""
i
0 4
1 0
2 7
3 8
"""
|
多列索引, 返回dataframe对象
1
2
3
4
5
6
7
8
|
df[[ "i" , "ii" ]]
"""
i ii
0 4 5
1 0 3
2 7 9
3 8 2
"""
|
同时索引行及列
通过指定索引名或切片方式进行索引
1
2
3
4
5
6
7
8
9
10
11
|
index = [ "a" , "f" , "c" , "h" ]
columns = [ "i" , "ii" , "iii" ]
df = pd.dataframe(data, index = index, columns = columns)
"""
i ii iii
a 4 5 9
f 0 3 4
c 7 9 1
h 8 2 3
"""
|
loc
通过指定行及列索引名进行索引, 返回dataframe对象
1
2
3
4
5
6
|
df.loc[[ "a" , "f" ], [ "ii" , "iii" ]]
"""
ii iii
a 5 9
f 3 4
"""
|
通过指定行及列索引名范围进行索引(包含边值), 返回dataframe对象
1
2
3
4
5
6
7
|
df.loc[ "a" : "c" , "ii" : "iii" ]
"""
ii iii
a 5 9
f 3 4
c 9 1
"""
|
iloc
通过指定行及列索引号进行索引, 返回dataframe对象
1
2
3
4
5
6
|
df.iloc[[ 0 , 1 ], [ 1 , 2 ]]
"""
ii iii
a 5 9
f 3 4
"""
|
通过指定行及列索引号范围进行切片索引(左闭右开), 返回dataframe对象
1
2
3
4
5
6
7
|
df.iloc[: 3 , 1 : 3 ]
"""
ii iii
a 5 9
f 3 4
c 9 1
"""
|
ix(不建议使用)
通过指定行及列索引号范围或名字范围进行切片, 返回dataframe对象
1
2
3
|
df.ix[ "a" : "c" , "i" : "iii" ]
df.ix[ "a" : "c" , 1 : 3 ]
df.ix[: 3 , 1 : 3 ]
|
tips: 只有使用 iloc 或 ix 按索引号进行切片索引时才为左闭右开, 其余全闭
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://segmentfault.com/a/1190000019380372