Python中的集合类型分类和集合类型操作符解析

时间:2022-04-09 16:05:19

集合类型
    数学上,把set称作由不同的元素组成的集合,集合(set)的成员通常被称作集合元素(set elements)。
    Python把这个概念引入到它的集合类型对象里。集合对象是一组无序排列的可哈希的值,集合成员可以做字典中的键。数学集合转为Python的集合对象很有效,集合关系测试和union、intersection等操作符在Python里也同样如我们所预想地那样工作。
    和其他容器类型一样,集合支持用in和not in操作符检查成员,由len()内建函数得到集合的基数(大小)用for循环迭代集合的成员。但是因为集合本身是无序的,不能为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值。
    集合(sets)有两种不同的类型:
           可变集合(set),可以添加和删除元素,不可哈希,不能用作字典的键也不能作为其他集合中的元素;
           不可变集合(frozenset),不可以添加和删除元素,有哈希值,能被用作字典的键或是作为集合中的一个成员。

集合类型的实际操作:

(1)如何创建集合类型和给集合赋值
        集合与列表( [ ] )和字典( { } ) 不同,没有特别的语法格式。列表和字典可以分别用他们自己的工厂方法 list() 和 dict() 创建,这也是集合被创建的唯一方法:用集合的工厂方法set()和frozenset()。

 >>> s = set('cheeseshop')                 # Python3.x
>>> s
{'s', 'o', 'h', 'e', 'c', 'p'}
>>> t = frozenset('bookshop')
>>> t
frozenset({'b', 's', 'k', 'o', 'h', 'p'})
>>> len(s),len(t)
(6, 6)
>>> s == t
False
>>>

create&assign

(2)如何访问集合中的值
       可以遍历查看集合成员或检查某项元素是否是一个集合中的成员。

 >>> 'g' not in t
True
>>> 'k' in t
True
>>> for i in s:
print(i) s
o
h
e
c
p
>>>

in/not in

(3)如何更新集合
         用各种集合内建的方法和操作符添加和删除集合的成员。只有可变集合能被修改,试图修改不可变集合会引发异常。

 >>> s
{'s', 'o', 'h', 'e', 'c', 'p'}
>>> s.add('z')
>>> s
{'s', 'o', 'h', 'e', 'c', 'p', 'z'}
>>> t
frozenset({'b', 's', 'k', 'o', 'h', 'p'})
>>> t.add('x')
Traceback (most recent call last):
File "<pyshell#29>", line 1, in <module>
t.add('x')
AttributeError: 'frozenset' object has no attribute 'add'
>>> s.update('pypi')
>>> s
{'s', 'o', 'h', 'e', 'c', 'p', 'i', 'y', 'z'}
>>> s.remove('z')
>>> s
{'s', 'o', 'h', 'e', 'c', 'p', 'i', 'y'}
>>> s -= set('pypi')
>>> s
{'s', 'o', 'h', 'e', 'c'}
>>>

change_set

(4)如何删除集合中的成员和集合
        删除集合成员remove()内建方法。删除集合本身,可以像删除任何Python对象一样,令集合超出它的作用范围或调用del将它们直接清除出当前的名字空间。如果它的引用计数为零,也会被标记以便被垃圾回收。如del s。

 >>> s.remove('c')
>>> s
{'s', 'o', 'h', 'e'}
>>> del s
>>> s
Traceback (most recent call last):
File "<pyshell#41>", line 1, in <module>
s
NameError: name 's' is not defined
>>>

delete element or set

   集合操作符和关系符号: 

Python中的集合类型分类和集合类型操作符解析

Python中的集合类型操作符的解析

(1)标准类型操作符(所有的集合类型)
成员关系 (in, not in)
        就序列而言,Python中的in和not in操作符决定某个元素是否是一个集合中的成员。
集合等价/不等价
       
等价/不等价被用于在相同或不同的集合之间做比较。两个集合相等是指,对每个集合而言,当且仅当其中一个集合中的每个成员同时也是另一个集合中的成员。也可以说每个集合必须是另一个集合的一个子集,
即s <= t 和s>= t 的值均为真(True),或(s <= t and s>= t)
的值为真(True)。集合等价/不等价与集合的类型或集合成员的顺序无关,只与集合的元素有关。
子集/超集
       
set用Python的比较操作符检查某集合是否是其他集合的超集或子集。“小于”符号(<、<=)用来判断子集,“大于”符号(>、
>= )用来判断超集。“小于” 和 “大于”意味着两个集合在比较时不能相等。等于号允许非严格定义的子集和超集。
        set支持严格( < )子集和非严格 ( <= ) 子集,也支持严格( > )超集和非严格 ( >=
)超集。只有当第一个集合是第二个集合的严格子集时,我们才称第一个集合“小于”第二个集合。同理,只有当第一个集合是第二个集合的严格超集时,我们才称第一个集合“大于”第二个集合。

    对象值的比较

任何相同类型的对象都可以比较,格式为:a == b,在python2.3之前类型不具有布尔值,返回值为1 0;2.3版本之后返回只为 True False

    对象身份的比较

obj1 is obj2               return True False

obj1 is not obj2         return True False

布尔类型--python中的与、或、非

布尔类型的优先级依次为:not

             and

            or

              --实现功能为逻辑 非 与 或

 标准类型的内建函数

cmp(obj1, obj2)       1 > 2 return i>0

                1 < 2 return i<0

               1 == 2 return i=0

repr(obj)/repr('obj')--返回一个对象的字符串表示

str(obj)--返回对象可读性好的字符串表示

type(obj)--返回对象的类型

 >>> s = set('cheeseshop')
>>> t = set('cheeseshop')
>>> s is t
False
>>> s is not t
True
>>> repr(s)
"{'s', 'o', 'h', 'e', 'c', 'p'}"
>>> str(s)
"{'s', 'o', 'h', 'e', 'c', 'p'}"
>>> type(s)
<class 'set'>
>>> s == t
True

(2)集合类型操作符(所有的集合类型)
联合( | )
        联合(union)操作和集合的 OR(又称可兼析取(inclusive
disjunction))其实是等价的,两个集合的联合是一个新集合,该集合中的每个元素都至少是其中一个集合的成员,即属于两个集合其中之一的成员。联合符号有一个等价的方法:union()。
交集( & )
       可以把交集操作比做集合的AND(或合取)操作。两个集合的交集是一个新集合,该集合中的每个元素同时是两个集合中的成员,即属于两个集合的成员。交集符号有一个等价的方法:intersection()。
差补/相对补集( – )
        两个集合(s 和 t)的差补或相对补集是指一个集合 C,该集合中的元素,只属于集合 s,而不属于集合 t。差符号有一个等价的方法:difference()。
对称差分( ^ )
       和其他的布尔集合操作相似,对称差分是集合的XOR(又称“异或” (exclusive
disjunction))。两个集合(s 和 t)的对称差分是指另外一个集合C,该集合中的元素,只能是属于集合 s
或者集合t的成员,不能同时属于两个集合。对称差分有一个等价的方法:symmetric_difference()。
混合集合类型操作
        如果左右两个操作数的类型相同,既都是可变集合或不可变集合,则所产生的结果类型是相同的。但如果左右两个操作数的类型不相同(左操作数是 set,右操作数是 frozenset,或相反情况),则所产生的结果类型与左操作数的类型相同 。

注意:加号不是集合类型的运算符。

Python中的集合类型分类和集合类型操作符解析

    集合操作符示意图

 >>> t = frozenset('bookshop')
>>> t
frozenset({'b', 's', 'k', 'o', 'h', 'p'})
>>> s = set('cheeseshop')
>>> s
{'s', 'o', 'h', 'e', 'c', 'p'}
>>> t | s
frozenset({'b', 's', 'k', 'o', 'h', 'e', 'p', 'c'})
>>> t ^ s
frozenset({'b', 'c', 'e', 'k'})
>>> s | t
{'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'}
>>> s ^ t
{'b', 'k', 'c', 'e'}
>>>

(3)集合类型操作符(仅适用于可变集合)
(Union) Update ( |= )
       这个更新方法从已存在的集合中添加(可能多个)成员,此方法和update()等价。

 >>> s = set('cheeseshop')
>>> id(s)
57600488
>>> s |= set('pypi')
>>> s
{'s', 'o', 'h', 'e', 'c', 'p', 'i', 'y'}
>>> id(s)
57600488
>>>
>>> s.update('hello')
>>> s
{'s', 'o', 'h', 'e', 'l', 'c', 'p', 'i', 'y'}
>>> id(s)
57600488
>>>

|= and update

保留/交集更新( &= )
       保留(或交集更新)操作保留与其他集合的共有成员,此方法和 intersection_update()等价。
差更新 ( –= )
       对集合s和t进行差更新操作s-=t,差更新操作会返回一个集合,该集合中的成员是集合s去除掉集合t中元素后剩余的元素。此方法和difference_update()等价。
对称差分更新( ^= )
        对集合s和t进行对称差分更新操作(s^=t),对称差分更新操作会返回一个集合,该集合中的成员仅是原集合s或仅是另一集合t中的成员。此方法和symmetric_difference_update()等价。

 >>> s = set('cheeseshop')
>>> t = set('bookshop')
>>> s
{'s', 'o', 'h', 'e', 'c', 'p'}
>>> t
{'b', 's', 'k', 'o', 'h', 'p'}
>>> id(s)
48141032
>>> id(t)
57892936
>>> s | t
{'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'}
>>> id(s | t) # 分配了新的内存
57893384
>>> s
{'s', 'o', 'h', 'e', 'c', 'p'}
>>> t
{'b', 's', 'k', 'o', 'h', 'p'}
>>>
>>> s |= t
>>> s
{'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'}
>>> t
{'b', 's', 'k', 'o', 'h', 'p'}
>>> id(s)
48141032
>>> id(t)
57892936
>>> >>> s = frozenset('cheeseshop')
>>> t = frozenset('bookshop')
>>> s
frozenset({'s', 'o', 'h', 'e', 'c', 'p'})
>>> t
frozenset({'b', 's', 'k', 'o', 'h', 'p'})
>>> id(s)
48141032
>>> id(t)
57600488
>>> s | t # 操作值存储于新分配的内存中
frozenset({'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'})
>>> id(s)
48141032
>>> id(t)
57600488
>>> s
frozenset({'s', 'o', 'h', 'e', 'c', 'p'})
>>> t
frozenset({'b', 's', 'k', 'o', 'h', 'p'})
>>>
>>> s |= t
>>> s # 操作值由s索引
frozenset({'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'})
>>> t
frozenset({'b', 's', 'k', 'o', 'h', 'p'})
>>> id(s) # s 指向了新的内存地址
57892936
>>> id(t)
57600488
>>>

而上述(|,&,-,^)等操作则会给执行结果分配新的内存空间存储(s,t值不变),故适用于所有集合。

由以上代码可知:(|=,&=,-=,^=)各操作时s的值即为操作的结果(即s值改变),对于不可变集合,s指向新的内存地址;对于可变集合,s指向的地址不变。

(以上均基于Python3.x的测试)。

Python中的集合类型分类和集合类型操作符解析的更多相关文章

  1. Python中,如何初始化不同的变量类型为空值

    参考文章  Python中,如何初始化不同的变量类型为空值 常见的数字,字符,很简单,不多解释. 列表List的其值是[x,y,z]的形式 字典Dictionary的值是{x:a, y:b, z:c} ...

  2. 初学者必知的Python中优雅的用法 分类: Python 2015-05-11 15&colon;02 782人阅读 评论&lpar;0&rpar; 收藏

    本文由 伯乐在线 - 淘小米 翻译,Daetalus 校稿.未经许可,禁止转载!英文出处:freepythontips.wordpress.com.欢迎加入翻译小组. Hi 朋友们.由于我最近都比较忙 ...

  3. Python中为什么推荐使用isinstance来进行类型判断?而不是type

    转自:http://www.xinxingzhao.com/blog/2016/05/23/python-type-vs-isinstance.html Python在定义变量的时候不用指明具体的的类 ...

  4. Python中让MySQL查询结果返回字典类型的方法

    import pymysql host='localhost' user='root' passwd='root' port=3306 db='test' db=pymysql.connect( ho ...

  5. Python中if &lowbar;&lowbar;name&lowbar;&lowbar; &equals;&equals; &&num;39&semi;&lowbar;&lowbar;main&lowbar;&lowbar;&&num;39&semi;,&lowbar;&lowbar;init&lowbar;&lowbar;和self 的解析

    1.2.1 一个.py文件被其他.py文件引用 假设我们有一个const.py文件,内容如下: 现在,我们写一个用于计算圆面积的area.py文件,area.py文件需要用到const.py文件中的P ...

  6. python中的坎坷之函数、集合

    函数 作用:实现一个功能,函数理解成一个工具,遇到问题把这个工具拿来用 优点:函数更方便,复用,可以在多个场景下用 1.带参数的函数 name='lzs-nice' nane.split('-') # ...

  7. python中的运算符的分类以及使用方法

    1.算数运算符 算数运算符的分类: +, –,  *,  **(幂运算),   /,  //(整除),  %(取余/取模) 算数运算符的优先级:  ()>  ** > *, /, % &g ...

  8. python中的函数的分类

    函数的种类 传参的基本要求 默认参数 *args 关键字参数 **kwargs 普通函数 带参数 默认参数 def text(a,b=2) print("haha") print( ...

  9. python高级(三)—— 字典和集合(泛映射类型)

    本文主要内容 可散列类型 泛映射类型 字典 (1)字典推导式 (2)处理不存在的键 (3)字典的变种 集合 映射的再讨论 python高级——目录 文中代码均放在github上:https://git ...

随机推荐

  1. ASP&period;NET MVC5&plus;EF6&plus;EasyUI 后台管理系统(17)-LinQ动态排序

    系列目录 首先修复程序中的一个BUG这个BUG在GridPager类中,把sord修改为sort这个名称填写错误,会导致后台一直无法获取datagrid的排序字段 本来是没有这一讲的,为了使20行的代 ...

  2. WordPress实现长篇文章&sol;日志&sol;单页面分页功能效果

    在WordPress里写文章,如果内容很多,你可能想要把文章分成几页来让访客浏览,这样既保持了网页的美观,也提高了网页的打开速度.但是在WordPress默认提供的按钮里,你可能找不到文章分页功能所对 ...

  3. 【转】Linux高级字符设备之Poll操作

    原文网址:http://www.cnblogs.com/geneil/archive/2011/12/04/2275559.html 在用户程序中,select()和poll()也是与设备阻塞与非阻塞 ...

  4. css中的颜色值

    下面是比较适合在测试页面中用来设置背景颜色的淡颜色,最好记住一些,dark.blue.red.green.gray.olive颜色较深.

  5. sqlserver关联更新问题

    大家都知道update更新语句:update 表名 set 字段=值.似乎很简单 但是今天我遇到这样一个问题:我需要更新一张叫PO_SPECIAL_TASK_LINE表的score字段,这个分数通过另 ...

  6. SSL&sol;TLS通信

    本文同时发表在https://github.com/zhangyachen/zhangyachen.github.io/issues/31 复习基本概念 对称密码:加密和解密使用同一密匙. 公钥密码: ...

  7. 高通非adsp 架构下的sensor的bug调试

    高通 sensor 从native到HAL 高通HAL层之Sensor HAL 高通HAL层之bmp18x.cpp 问题现象: 当休眠后,再次打开preesure sensor的时候,会出现隔一段时候 ...

  8. 利用PHP将图片转换成base64编码的实现方法

    先来说一下为什么我们要对图片base64编码 base64是当前网络上最为常见的传输8Bit字节代码的编码方式其中之一.base64主要不是加密,它主要的用途是把某些二进制数转成普通字符用于网络传输. ...

  9. activity之间參数传递&amp&semi;amp&semi;&amp&semi;amp&semi;获取activity返回值&amp&semi;amp&semi;&amp&semi;amp&semi;activity生命周期

    Activity之间參数传递 A activity想将參数传给B activity时能够利用Intent将消息带过去 Intent intent = new Intent(this,BActivity ...

  10. DAO&comma;SERVICE