元组：

作用：存多个值，元组不可变，主要用来读

age=(11,22,33,44,55)

print(age[2])　　#取出元组内的值

print(age[1:4])　　#取出元组内的某些值

print(age.index(33))　　#取出33的索引

print(age.count(33))　　#取出值得数量

字典类型：

作用：存多个值，key-value存取，取值速度快。

定义:key必须是不可变类型，value可以是任意类型。

#取出字典的值

info={'name':'yangshuai','age':22,'sex':'male'}

print(info('age'))

重要操作：

*.pop()　　#删除字典内的某个值，括号内输入的是key的值

*.pop('sasadsad',None)　　#当取出某个不存在的值得时候会报错，这样定义可以在取不存在的值得时候输出自定义的值。

*.get()　　#取出字典内的值，括号内输入的是可以的值

*.get('sdasdasd',None)　　#跟get同理

掌握的：

*.popitem()　　#随机弹出一个key-value值

*.keys()　　　　#输出字典的所有的key

*.values()　　#取出字典所有的values

打印字典中的所有值：

定义一个字典dic，　　for key.values in dic.items():　　print(key,values)

*.clear()　　#清空字典

*.formkeys()　　#利用输入的内容快速创建一个字典：　　

　　dic=info.formkeys(['name','age','sex'],1111)　　#注意这样传入的值，所有value都是一样的，只有key是不同的。

*.update()　　#括号内放的是以字典，是将括号内字典的内容更新到旧的字典中，不存在的加入，存在的替换。

另外一种方式创建字典：

　　print(dict([('name','yangshuai'),('age',18),('sex','male')]))

*.setdefault()小练习：

　　#定义一个空字典，加一条用户的详细信息，各种参数加入

d={}

print(d)

d['name']='yangshuai'

d['age']=18

d['sex']='male'

#d['hobby']=[]    #多个可以不断变化，最好利用列表来表示

#d['hobby'].append('play basketball')

#d['hobby'].append('paly football')

#当加入字典的一个key对应多个值的时候,需要先定义一个新空列表，一个个往里边加值，这样我们可以利用*.setdefault()这个参数，简写程序。
d.setdefault('hobby',[]).append('paly basketball')
d.setdefault('hobby',[]).append('paly football')
print(d)

字典练习：

　　有如下值集合 [11,22,33,44,55,66,77,88,99,90...]，将所有大于 66 的值保存至字典的第一个key中，将小于 66 的值保存至第二个key的值中。

a={'k1':[],'k2':[]}

c=[11,22,33,44,55,66,77,88,99,90]

for i in c:

    if i>66:

        a['k1'].append(i)

    else:

        a['k2'].append(i)

print(a)

　　统计s='hello alex alex say hello sb sb'中每个单词的个数，结果如：{'hello': 2, 'alex': 2, 'say': 1, 'sb': 2}

s='hello alex alex say hello sb sb'

l=s.split()

dic={}

for item in l:

    if item in dic:

        dic[item]+=1

    else:

        dic[item]=1

print(dic)

集合：

作用：去重，关系运算

集合内的可以有多个元素，但是每个元素都是不可变类型，即可hash类型。

集合内的元素唯一

定义：s={1，‘ss’，2，34,2,424}

优先掌握的用法：

判断某个值在不在集合中：　　value in 字典

关系运算：　　

s1={1,10,11,22}

s2={1,11,33}
#求两个交集
print(s1 & s2)
#求两个并集
print(s1 | s2)
#求差集
#只在s1内的，不在s2的
print(s1-s2)
#求不同时在s1和s2的，对称差集
print(s1 ^ s2)
#谁是谁的父集,s1 >= s2
#谁是谁的子集,s1 <= s2
s1={1,2,3,4}
s2={1,2}
print(s1 <= s2)
print(s1 >= s2)

去重小练习：

　　 1. 有列表l=['a','b',1,'a','a']，列表元素均为可hash类型，去重，得到新列表,且新列表无需保持列表原来的顺序

　　 2.在上题的基础上，保存列表原来的顺序

　　 3.去除文件中重复的行，肯定要保持文件内容的顺序不变
　　 4.有如下列表，列表元素为不可hash类型，去重，得到新列表，且新列表一定要保持列表原来的顺序

l=[
    {'name':'egon','age':18,'sex':'male'},
    {'name':'alex','age':73,'sex':'male'},
    {'name':'egon','age':20,'sex':'female'},
    {'name':'egon','age':18,'sex':'male'},
    {'name':'egon','age':18,'sex':'male'},
]

#去重,无需保持原来的顺序

l=['a','b',1,'a','a']

print(set(l))

#去重,并保持原来的顺序

#方法一:不用集合

l=[1,'a','b',1,'a']

l1=[]

for i in l:

    if i not in l1:

        l1.append(i)

print(l1)

#方法二:借助集合

l1=[]

s=set()

for i in l:

    if i not in s:

        s.add(i)

        l1.append(i)

print(l1)

#同上方法二,去除文件中重复的行

import os

with open('db.txt','r',encoding='utf-8') as read_f,\

        open('.db.txt.swap','w',encoding='utf-8') as write_f:

    s=set()

    for line in read_f:

        if line not in s:

            s.add(line)

            write_f.write(line)

os.remove('db.txt')

os.rename('.db.txt.swap','db.txt')

#列表中元素为可变类型时,去重,并且保持原来顺序

l=[

    {'name':'egon','age':18,'sex':'male'},

    {'name':'alex','age':73,'sex':'male'},

    {'name':'egon','age':20,'sex':'female'},

    {'name':'egon','age':18,'sex':'male'},

    {'name':'egon','age':18,'sex':'male'},

]

# print(set(l)) #报错:unhashable type: 'dict'

s=set()

l1=[]

for item in l:

    val=(item['name'],item['age'],item['sex'])

    if val not in s:

        s.add(val)

        l1.append(item)

print(l1)

#定义函数,既可以针对可以hash类型又可以针对不可hash类型

def func(items,key=None):

    s=set()

    for item in items:

        val=item if key is None else key(item)

        if val not in s:

            s.add(val)

            yield item

print(list(func(l,key=lambda dic:(dic['name'],dic['age'],dic['sex']))))
--摘自老男孩egon笔记

集合内置方法：

定义集合A，集合B

　　求交集：print(A.intersection(B))

　　求并集：print(A.union(B))

　　求差集：print(A.difference(B))

　　求对称差集（去掉共同部分）：print(A.symmetric_difference(B))

　　A.add()　　#向集合添加值

　　A.pop()　　#随机删除值

　　A.remove()　　#指定删除值

　　A.discard()　　#删除不存在的值可以不报错

数据类型总结：

按照存值个数区分：

　　标量/原子类型：数字，字符串

　　容器类型：列表，元组，字典

按照不可变区分：

　　可变：字典，列表

　　不可变：数字，字符串，元组

按访问顺序区分：

　　访问方式：数字

　　按照索引访问：　字符串，列表，元组

　　按照映射访问：字典

秒客网

Day2_元组_字典_集合_字符编码_文件处理

元组：

字典类型：

集合：

数据类型总结：

相关文章