python基础之02列表/元组/字典/set集合

python中内置的数据类型有列表（list）元组（tuple）字典（directory）。

1 list

list是一种可变的有序的集合。来看一个list实例：

#第一种方法:

>>> name=['liming','xiaohong',]

>>> name

['liming', 'xiaohong']

#第二种方法:

>>> age=list([18,17,])

>>> age

[18, 17]

list有许多功能：

>>> name

['liming', 'xiaohong']

>>> len(name)

2

>>> name.__len__()

2

__len__()查看list中元素的个数

>>> name

['liming', 'xiaohong', 'xiaoqiang']

>>> name[2]

'xiaoqiang'

查看索引值所对应的元素

>>> name

['liming', 'xiaohong', 'xiaoqiang']

>>> name.index('xiaohong')

1

#如果没有该元素，则会报错

>>> name.index('xiao')

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

ValueError: 'xiao' is not in list

index()查看元素所对应的索引值

>>> name

['liming', 'xiaohong', 'xiaoqiang']

>>> name.append('xiaohuang')

>>> name

['liming', 'xiaohong', 'xiaoqiang', 'xiaohuang']

append()追加元素到末尾

>>> name

['liming', 'xiaohong', 'xiaoqiang']

>>> name.insert(1,'yefan')

>>> name

['liming', 'yefan', 'xiaohong', 'xiaoqiang']

insert()插入元素到指定索引位置

>>> name

['liming', 'yefan', 'xiaohong']

>>> result=name.pop()

#将最后一个元素赋值给result

>>> name

['liming', 'yefan']

>>> result

'xiaohong'

pop()删除最后一个元素

>>> name

['liming', 'yefan', 'xiaoqiang']

>>> name.pop(1)

'yefan'

>>> name

['liming', 'xiaoqiang']

remove()删除指定位置的元素

>>> name

['liming', 'yefan', 'xiaoqiang']

>>> name[1]='xiaohong'

>>> name

['liming', 'xiaohong', 'xiaoqiang']

将某个元素替换成其他元素

>>> name

['liming', 'xiaohong', 'xiaoqiang']

>>> name.extend(['yefan','heihuang',])

>>> name

['liming', 'xiaohong', 'xiaoqiang', 'yefan', 'heihuang']

extend()追加列表到末尾

>>> name

['liming', 'xiaohong', 'xiaoqiang', 'yefan', 'heihuang']

>>> name.reverse()

>>> name

['heihuang', 'yefan', 'xiaoqiang', 'xiaohong', 'liming']

reverse()反转元素顺序

另外，list元素也可以是另一个list(字典也可以)：

>>> name=['liming', 'xiaohong', 'xiaoqiang']

>>> age

[18, 17]

>>> name.append(age)

>>> name

['liming', 'xiaohong', 'xiaoqiang', [18, 17]]

再来看list中一个让我刚学习时比较纠结的例子：

>>> n=[1]

>>> l=n

>>> l

[1]

>>> n=[4]

>>> l

[1]

#上例中n变了，l没有变

>>> n=[1,2]

>>> g=n

>>> g

[1, 2]

>>> n[1]=3

>>> g

[1, 3]
#在这里，n变了，g也跟着变了！！！

靠！这是为什么呢？欲知原因，请看--我的另一个博文 python基础之赋值/深copy/浅copy

当我们想要创建一个比较繁琐的list的时候，可能会用到循环，比如，我们要创建list为：[1,4,9,16,25……100]时。可能就会这样写：

l=[]

for i in range(1,11):

    a=i*i

    l.append(a)

print(l)

是不是感觉很麻烦，在python中，我们其实可以用一行代码来实现这个list，这里就要用到列表生成式了：

列表生成式：

>>> [i*i for i in range(1,11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

说一下格式：元素(上例中为i*i)+空格+生成元素的表达式（这样说其实并不准确，但我感觉墨水较少，实在是无法准确的形容。上例中为：for i in range(1,11)）

列表生成式也可以帮助我们实现一些更为复杂的list：

#可以有两层循环

print([m+n for m in range(3) for n in range(3)])

[0, 1, 2, 1, 2, 3, 2, 3, 4]

print([m+n for m in 'abc' for n in 'abc'])

['aa', 'ab', 'ac', 'ba', 'bb', 'bc', 'ca', 'cb', 'cc']

　　#for循环后面还可以加上if判断，这样我们就可以筛选出仅偶数的平方：

>>> [x * x for x in range(1, 11) if x % 2 == 0]

[4, 16, 36, 64, 100]

#将格式化和列表生成式相结合 print(['%s%s' % (i,i) for i in range(1,11)]) ['', '', '', '', '', '', '', '', '', '']

事实上，不仅可以有两层循环，三层或者更多层也是可以的。

2 tuple

是一种另类的list，但是他的功能相较于list要少，因为tuple不支持修改，也就是不支持append，pop，extend，insert……

定义一个tuple：

#第一种方法

>>> age=(1,3)

>>> age

(1, 3)

#第二种方法

>>> age=tuple((1,4,))

>>> age

(1, 4)

如果要定义一个空的tuple，可以写成()：

>>> age=()

>>> age

()

但是，要定义一个只有1个元素的tuple，如果你这么定义：

>>> age=(1)

>>> age

1

>>> type(age)

<class 'int'>

定义的不是tuple，是1这个数！这是因为括号()既可以表示tuple，又可以表示数学公式中的小括号，这就产生了歧义，因此，Python规定，这种情况下，按小括号进行计算，计算结果自然是1。

所以一般定义只有一个元素的tuple时，要加个逗号：

>>> age=(1,)

>>> age

(1,)

实际上tuple也是可变的，前文中所说的不可变指的是tuple元素不可变，但是tuple中的元素的元素是可以改变的。

>>> info=(['liming','',],['xiaohong','',])

>>> info

(['liming', ''], ['xiaohong', ''])

>>> info[1][1]=12

>>> info

(['liming', ''], ['xiaohong', 12])

在这个例子中改变的不是tuple的元素，而是list的元素。

3 directory

字典是无序的由键值对组成的集合，具有极快的查找速度。元素可以是list tuple directory

为什么说dict具有极快的查找速度？现在来看一个小程序：

name=['liming','xiaohong','xiaoqiang',]

score=[88,77,66,]

in_name=input('Please input your name:')

in_name.strip()　　

index_name=name.index(in_name)

score_of_name=score[index_name]

print('Your score is:%s'%(score_of_name))

当列表的元素越多，输入名字后匹配到的时间就越长。因为我们需要遍历整个list，然后匹配到相应的name以及score。

如果用dict实现，只需要一个“名字”-“成绩”的对照表，这个对照表是按照一定的计算方法存放的，什么计算方法呢？打个比方，我们可以根据名字的首字母在字母表中的顺序，首字母相同的名字再根据第二字母在字母表中的顺序排序，以此类推……。这样我们查找名字时就会方便快捷很多。直接根据名字查找成绩，无论这个表有多大，查找速度都不会变慢。以上只是打比方，实际上dict可能是根据hash来进行排序计算，有兴趣的同学可以搜索一下。

定义一个字典：

>>> info={'liming':16,'xiaohong':12}

>>> info

{'xiaohong': 12, 'liming': 16}

#格式是一个唯一的键对应一个值。

但是，当第二次定义一个键时，会出现这种情况：

>>> info

{'xiaohong': 12, 'liming': 16}

>>> info={'liming':16,'xiaohong':12,'liming':12}

>>> info

{'xiaohong': 12, 'liming': 12}

也就是第二个相同的键会覆盖掉第一个相同的键

对某个键的值进行修改：

>>> d['liming']

88

>>> d

{'xiaohong': 77, 'liming': 88}

>>> d['liming']

88

>>> d['liming']=99

>>> d

{'xiaohong': 77, 'liming': 99}

但是如果当这个键不存在时，就会报错：

>>> d

{'xiaohong': 77, 'liming': 99}

>>> d['xiao']

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

KeyError: 'xiao'

#我们可以用in或者字典所提供的get功能来判断键是否存在

#in

>>> d

{'xiaohong': 77, 'liming': 99}

>>> 'xiaohong' in d

True

#注意仅仅是找键，而不是找值：

>>> 77 in d

False

#get

>>> d.get('xiaohong')

77

#当不存在时，可以定义返回值，默认返回值是None

>>> d.get('xiao')

>>> result=d.get('xiao',0)

>>> result

0

和list比较，dict有以下几个特点：

查找和插入的速度极快，不会随着key的增加而变慢；
需要占用大量的内存，内存浪费多。

而list相反：

查找和插入的时间随着元素的增加而增加；
占用空间小，浪费内存很少。

要保证hash的正确性，作为key的对象就不能变。在Python中，字符串、整数等都是不可变的，因此，可以放心地作为key。而list是可变的，就不能作为key：

>>> score

[88, 77, 66]

>>> name

['liming', 'xiaohong', 'xiaoqiang']

>>> d={name:score,'liming':99}

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

TypeError: unhashable type: 'list'

dict的功能：

#当[]中的键不存在时，即为添加

>>> dic={'liming':15}

>>> dic['xiaohong']=20

>>> dic

{'liming': 15, 'xiaohong': 20}

#当[]内的键存在时，即为修改

>>> dic

{'liming': 15, 'xiaohong': 20}

>>> dic['liming']=20

>>> dic

{'liming': 20, 'xiaohong': 20}

dic[]=添加新的键值对/修改某个键的值

>>> d

{'xiaohong': 77, 'liming': 99}

>>> d.clear()

>>> d

{}

clear()清空字典

d

{'xiaohong': 77, 'liming': 99}

>>> d.get('xiaohong')

77

>>> d.get('xiao')

>>> result=d.get('xiao',0)

>>> result

0

get()获取某个键是否在该字典中，若存在，则返回对应的value，若不存在，则默认返回None，可以自定义返回值

>>> d

{'xiaohong': 77, 'liming': 99}

>>> d.keys()

dict_keys(['xiaohong', 'liming'])

keys()列出所有的键key

>>> d

{'xiaohong': 77, 'liming': 99}

>>> d.values()

dict_values([77, 99])

values()列出所有的值values

>>> d

{'xiaohong': 88, 'liming': 99}

>>> d.update({'xiaohong':77})

>>> d

{'xiaohong': 77, 'liming': 99}

>>> d['xiaohong']=66

>>> d

{'xiaohong': 66, 'liming': 99}

update()更新某个键的值

>>> d

{'xiaohong': 66, 'liming': 99}

>>> d.pop('xiaohong')

66

>>> d

{'liming': 99}

pop()删除某个键值对

4 set集合

set集合类似于dict，查找速度十分快，无序，不重复。但是，set仅仅是key的集合，并没有value。

定义set

>>> a=set([1,1,2,3,4,4,5,])

>>> a

{1, 2, 3, 4, 5}

#重复的会被过滤

set的功能：

>>> a

{1, 2, 3, 4, 5}

>>> a.add(7)

>>> a

{1, 2, 3, 4, 5, 7}

add()添加元素

>>> a

{1, 2, 3, 4, 5, 7}

>>> a.clear()

>>> a

set()

clear()清空所有元素

#有两种取差集

#一种是普通差集，一种是对称差集。

#先看普通差集：

>>> a

{1, 2, 3}

>>> b

{2, 3, 4}

>>> a.difference(b)

{1}

#a并没有改变

>>> a

{1, 2, 3}

#我们可以将a.difference(b)赋值给一个变量

>>> ret=a.difference(b)

>>> ret

{1}

#有另一种方法可以直接将差集赋值给a

>>> a.difference_update(b)

>>> a

{1}

#对称差集就是a.difference(b) 和b.difference(a)合并

>>> a

{1, 2, 3}

>>> b

{2, 3, 4}

>>> a.symmetric_difference(b)

{1, 4}

difference() difference_update()取差集

>>> a

{1, 2, 3}

>>> b

{2, 3, 4}

>>> a.intersection(b)

{2, 3}

#更新自身的取交集

>>> a

{1, 2, 3}

>>> b

{2, 3, 4}

>>> a.intersection_update(b)

>>> a

{2, 3}

intersection() intersection_update()取交集

>>> b

{3, 4}

>>> ret = b.pop()

>>> ret

3

>>> b

{4}

pop()删除某个元素

秒客网

python基础之02列表/元组/字典/set集合

相关文章