基础数据 补充 set() 集合 深浅拷贝

时间:2022-04-05 20:00:18

一  对字符串的操作

li = ["张曼玉", "朱茵", "关之琳", "刘嘉玲"]
s = "_".join(li)
print(s) # 张曼玉_朱茵_关之琳_刘嘉玲 li = "哈哈哥"
s = "_".join(li)
print(s) # 哈_哈_哥 ####### 经过 join() 处理之后 就会变成字符串 li = "哈哈哥,嘻嘻姐,呵呵妹"
s = li.split(",")
print(s) ## ['哈哈哥', '嘻嘻姐', '呵呵妹'] ###### 经过 split() 处理之后,会变成 列表
## 他俩是 字符串 和 列表的 相互转化

二 列表  循环删除列表的每一个元素

## for 循环原理:

  for 的运行过程,会有一个指针来记录当前循环的元素是哪一个,一开始这个指针指向第0个,然后获取到第0个元素,紧接着删除第0个元素,这个时候.原来是第一个的元素会自动变成第0个,相当于向前移动补位了.然后指针向后移动一次,指向2 元素,这个时候 1向前移动了,也就不会再删除了,  包括列表的  remove 和 pop 都是删除不干净的

# 只有这样才是可以 的

li = ["张曼玉","朱茵","关之琳","邱淑贞"]

for  i in range(len(li)):  ## 循环 len(li)次,然后从后往前删
li.pop()
print(li) li = ["张曼玉","朱茵","关之琳","邱淑贞"]
lst = [] for i in li:
lst.append(i) for el in lst:
li.remove(el)
print(li) ### 循环老列表,把要删除的元素放进新的列表中
### 循环新的列表,得到要删除的元素,用 remove()的 指名道姓删除的特### 性,进项删除 ## 简单说:循环老列表删除新列表

三  set 集合

  set 集合是python的一个基础数据类型,不常用,set 中的元素是不重复的,无序的 ,里边的元素必须是 可 hash 的

也就是不可变的数据类型 (int,str,tuple,bool)   也可以这样 理解: set 就是 dict 类型数据 的 key,定义的时候是set(),

用 {} 表示

## 注意 set 集合中的 元素必须是可 hash的,但是 本身是 不可 hash 的 ,set 是可变的

set1 = {'','alex',2,True,[1,2,3]} # 报错
set2 = {'','alex',2,True,{1:2}} # 报错
set3 = {'','alex',2,True,(1,2,[2,3,4])} # 报错

## 注意 set 集合是 无序的,不重复的

s = {"周杰伦", "周杰伦", "周星星"}
print(s)
结果:
{'周星星', '周杰伦'} ## 利用这个机制,可以把列表转化成 set集合,去重,再 转化成列表
## 这个是 python 中去重最快的,没有之一
## 唯一的不足就是,set 无序,转化之后需要重新排序
## python中 去重比较麻烦,排序就简单多了
## 和set 的去重相比较,这个无序,可以忽略不计了

# 给list去重复
lst = [45, 5, "哈哈", 45, '哈哈', 50]
lst = list(set(lst)) # 把list转换成set, 然后再转换回list
print(lst)

## set 集合的  增删改查

1.增

s = {"刘嘉玲", '关之琳', "王祖贤"}
s.add("郑裕玲")
print(s) # {'关之琳', '郑裕玲', '王祖贤', '刘嘉玲'}
s.add("郑裕玲") # 重复的内容不会被添加到set集合中
print(s)
s = {"刘嘉玲", '关之琳', "王祖贤"}
s.update("麻花藤") # 迭代更新
print(s) #{'花', '麻', '关之琳', '王祖贤', '刘嘉玲', '藤'}
s = {"刘嘉玲", '关之琳', "王祖贤"}
s.update(["张曼玉", "李若彤","李若彤"])
print(s) # {'刘嘉玲', '关之琳', '王祖贤', '李若彤', '张曼⽟'}

2.删

s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
item = s.pop() # 随机弹出一个.
print(s)
print(item) ## pop是有 返回值的 s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
s.remove("关之琳") # 直接删除元素
s.remove("麻⻁疼") # 不存在这个元素. 删除会报错
print(s) s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
s.clear() # 清空set集合.需要注意的是set集合如果是空的. 打印出
# 来是set() 因为要和dict区分的.
print(s) # set()

3.改

# set 集合中的 数据没有索引,也没有办法去定位一个元素,所以没办法进行直
# 接修改,我们可以采用先 删除 再 添加的方式来完成 修改操作 s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}
## 把 张曼玉 改成 朱茵
s.remove("张曼玉")
s.add("朱茵")
print(s)

4.查

#  set 是一个可 迭代对象 ,所以 可以进行 for 循环

s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"}

for el in s:
print(el)

5.常用操作

s1 = {"刘嘉玲", '关之琳'}
s2 = {"王祖贤","张曼玉", "李若彤","刘嘉玲"} # 交集 & 两个集合公有的 元素
print(s1 & s2) # {'刘嘉玲'}
print(s1.intersection(s2)) # {'刘嘉玲'} # 并集 | 两个集合所有的元素合并到一起,重复的自动去掉 print(s1 | s2) # {'张曼玉', '李若彤', '王祖贤', '刘嘉玲', '关之琳'}
print(s1.union(s2)) # {'张曼玉', '李若彤', '王祖贤', '刘嘉玲', '关之琳'} ## 差集 - 得到第一个集合 单独存在的元素
print(s1 - s2) # {'关之琳'}
print(s1.difference(s2)) # {'关之琳'} ## 反交集 ^ 两个集合中单独存在的数据 print(s1 ^ s2) ## {'王祖贤', '关之琳', '李若彤', '张曼玉'}
print(s1.symmetric_difference(s2)) ## 子集 < 判断 是不是 True False
## 如果 s1 里边的元素 在 s2中 全部存在 就是 子集 print(s1 < s2)
print(s1.issubset(s2)) # False ## 超级 >
print(s1 > s2)
print(s1.issuperset(s2)) #False

## set 集合本身 是可以 发生 改变的 ,是不可 hash 的,  也就是 可变的 ,我们可以使用冻结集合来保存数据

##   frozenset (不可变集合)   也就变成了 一个 可哈希的 数据 类型

s = frozenset(["王祖贤","张曼玉", "李若彤","刘嘉玲"])
dic = {s:""} #可以正常使用了
print(dic) # {frozenset({'刘嘉玲', '李若彤', '张曼⽟', '王祖贤'}): '123'}

四  深浅拷贝

lst = ["王祖贤","张曼玉", "李若彤","刘嘉玲","朱茵"]
lst1 = lst
print(lst1)
print(lst)
# 结果:
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵']
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵'] lst.append("张敏")
print(lst)
print(lst1)
# 结果:
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵', '张敏']
#['王祖贤', '张曼玉', '李若彤', '刘嘉玲', '朱茵', '张敏'] print(id(lst)) #
print(id(lst1)) # 24849304 内存地址是一样的

## 对于 list  set  dict  来说,直接赋值,其实是把内存地址 交给变量,并不是 复制 一份内容 ,所以 lst 和  lst1 的 内存##  指向是一  样的,  lst 改变了,lst1 也发生了 改变

1.浅拷贝

lst1 = ["刘备","关羽","张飞","曹操","孙权"]
lst2 = lst1.copy()
lst1.append("诸葛亮") print(lst1)
print(lst2) print(id(lst1),id(lst2)) """
['刘备', '关羽', '张飞', '曹操', '孙权', '诸葛亮']
['刘备', '关羽', '张飞', '曹操', '孙权'] 26553240 26422168
"""
## 结果 两个lst 完全不一样,内存地址和内容也不一样,实现了 内存的拷贝
lst1 = ["刘备",["关羽","张飞"],"曹操","孙权"]
lst2 = lst1.copy() lst1[1].append("诸葛亮")
print(lst1)
print(lst2) print(id(lst1),id(lst2)) """
['刘备', ['关羽', '张飞', '诸葛亮'], '曹操', '孙权']
['刘备', ['关羽', '张飞', '诸葛亮'], '曹操', '孙权']
21244824 21380432 """
lst1 = ["刘备",["关羽","张飞"],"曹操","孙权"]
lst2 = lst1.copy() print(id(lst1[0]))
print(id(lst2[0]))
## 结果是 

20904368
20904368


####  浅拷贝: 只会拷贝第一层,第二层的内容不会拷贝,所以称为浅拷贝

2.深拷贝

import copy
lst1 = ["刘备",["关羽","张飞"],"曹操","孙权"]
lst2 = copy.deepcopy(lst1) lst1[1].append("诸葛亮") print(lst1)
print(lst2) print(id(lst1),id(lst2)) """
['刘备', ['关羽', '张飞', '诸葛亮'], '曹操', '孙权']
['刘备', ['关羽', '张飞'], '曹操', '孙权']
24652696 24788304
"""

### 都不一样了,深度拷贝,把元素内部的元素完全进行 拷贝复制,不会产生一个改变 另一个跟着改变的问题

a = [1, 2]
a[1] = a
print(a[1]) ## 结果是 # [1,[...]]
print(s)