集合:一个集合中,任何两个元素都认为是不相同的,即每个元素只能出现一次。每个元素的地位都是相同的,元素之间是无序的。
- 创建集合set
python set类是在python的sets模块中,大家现在使用的python2.7.x中,不需要导入sets模块可以直接创建集合。
set('boy')
Out[1]: {'b', 'o', 'y'}
#创建一个数据框
df = pd.DataFrame({'auth':['spring','summer','fall','spring'],
'sply':['a','c','a','b'],
'name':['zhangsan','lisi','xiaohua','xiaomei']}) df
Out[58]:
auth sply name
0 spring a zhangsan
1 summer c lisi
2 fall a xiaohua
3 spring b xiaomei
#创建一个集合
a= set(df["auth"].values) a
Out[60]: {'fall', 'spring', 'summer'}
- 集合添加和删除
python 集合的添加有两种常用方法,分别是add和update。
集合add方法:是把要传入的元素做为一个整个添加到集合中,例如:
set('boy')
Out[1]: {'b', 'o', 'y'} a = set('boy') a.add('python') a
Out[4]: {'b', 'o', 'python', 'y'}
集合update方法:是把要传入的元素拆分,做为个体传入到集合中,例如:
a = set('boy') a.update('python') a
Out[7]: {'b', 'h', 'n', 'o', 'p', 't', 'y'}
集合删除操作方法:remove
a=set(['y', 'python', 'b', 'o']) a.remove('python') a
Out[16]: {'b', 'o', 'y'}
- python set() 集合操作符号、数学符号
集合的交集、合集(并集)、差集,了解python集合set与列表list的这些非常好用的功能前,要先了解一些集合操作符号
a = set('abc')
b = set('cdef') #交集
a&b
Out[20]: {'c'} #并集
a|b
Out[22]: {'a', 'b', 'c', 'd', 'e', 'f'} #相对补集,差集
a - b
Out[24]: {'a', 'b'}