10 Python 数据类型—集合

2017-11-12 大黄蜂

Python set基本数据类型 的一种 集合 类型,它有可变集合(set())和不可变集合(frozenset)两种。创建 集合set集合set添加集合删除交集并集差集 的操作都是非常实用的方法。

  1. python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算.  
  2. sets 支持 x  in set, len(set),和  for x  in set。作为一个无序的集合,sets不记录元素位置或者插入点。因此,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操作。 

1 x = set('spam')
2 y = set(['h','a','m'])
3 z = {1, 4, 5, 3, 7, 8}
4 print(x, y, z)
5 
6 {'a', 'm', 's', 'p'} {'a', 'h', 'm'} {1, 3, 4, 5, 7, 8}

集合

 1 x = set('spam')
 2 y = set(['h','a','m'])
 3 z = {1, 4, 5, 3, 7, 8}
 4 print(x, y, z)
 5 print(x & y)  # 交集
 6 
 7 {'m', 'a'}
 8 print(x | y)  # 并集
 9 
10 {'p', 's', 'm', 'h', 'a'}
11 print(x - y)
12 print(y - x)  # 差集
13 
14 {'p', 's'}
15 {'h'}

交集,并集, 差集

集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:

去重,把一个列表变成集合,就自动去重了。

关系测试,测试两组数据之前的交集、差集、并集等关系

1,集合的创建


1 set1 = set({1,2,'barry'})
2 set2 = {1,2,'barry'}
3 print(set1,set2)  # {1, 2, 'barry'} {1, 2, 'barry'}

View Code

2,集合的增


 1 set1 = {'alex','wusir','ritian','egon','barry'}
 2 set1.add('景女神')
 3 print(set1)
 4 
 5 #update:迭代着增加
 6 set1.update('A')
 7 print(set1)
 8 set1.update('老师')
 9 print(set1)
10 set1.update([1,2,3])
11 print(set1)

View Code

3,集合的删


 1 set1 = {'alex','wusir','ritian','egon','barry'}
 2 
 3 set1.remove('alex')  # 删除一个元素
 4 print(set1)
 5 
 6 set1.pop()  # 随机删除一个元素
 7 print(set1)
 8 
 9 set1.clear()  # 清空集合
10 print(set1)
11 
12 del set1  # 删除集合
13 print(set1)

View Code

4,集合的其他操作:

4.1 交集。(&  或者 intersection)


1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 & set2)  # {4, 5}
4 print(set1.intersection(set2))  # {4, 5}

View Code

4.2 并集。(| 或者 union)


1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 | set2)  # {1, 2, 3, 4, 5, 6, 7}
4 
5 print(set2.union(set1))  # {1, 2, 3, 4, 5, 6, 7}

View Code

4.3 差集。(- 或者 difference)


1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 - set2)  # {1, 2, 3}
4 print(set1.difference(set2))  # {1, 2, 3}

View Code

4.4反交集。 (^ 或者 symmetric_difference)


1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 ^ set2)  # {1, 2, 3, 6, 7, 8}
4 print(set1.symmetric_difference(set2))  # {1, 2, 3, 6, 7, 8}

View Code

4.5子集与超集


1 set1 = {1,2,3}
2 set2 = {1,2,3,4,5,6}
3 
4 print(set1 < set2)
5 print(set1.issubset(set2))  # 这两个相同,都是说明set1是set2子集。
6 
7 print(set2 > set1)
8 print(set2.issuperset(set1))  # 这两个相同,都是说明set2是set1超集。

View Code

5,frozenset不可变集合,让集合变成不可变类型。


1 s = frozenset('barry')
2 print(s,type(s))  # frozenset({'a', 'y', 'b', 'r'}) <class 'frozenset'>

View Code

二,深浅copy

1,先看赋值运算。


 1 l1 = [1,2,3,['barry','alex']]
 2 l2 = l1
 3 
 4 l1[0] = 111
 5 print(l1)  # [111, 2, 3, ['barry', 'alex']]
 6 print(l2)  # [111, 2, 3, ['barry', 'alex']]
 7 
 8 l1[3][0] = 'wusir'
 9 print(l1)  # [111, 2, 3, ['wusir', 'alex']]
10 print(l2)  # [111, 2, 3, ['wusir', 'alex']]

View Code

对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。

2,浅拷贝copy。


 1 l1 = [1,2,3,['barry','alex']]
 2 
 3 l2 = l1.copy()
 4 print(l1,id(l1))  # [1, 2, 3, ['barry', 'alex']] 2380296895816
 5 print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2380296895048
 6 
 7 l1[1] = 222
 8 print(l1,id(l1))  # [1, 222, 3, ['barry', 'alex']] 2593038941128
 9 print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2593038941896
10 
11  
12 l1[3][0] = 'wusir'
13 print(l1,id(l1[3]))  # [1, 2, 3, ['wusir', 'alex']] 1732315659016
14 print(l2,id(l2[3]))  # [1, 2, 3, ['wusir', 'alex']] 1732315659016

View Code

对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性。

3,深拷贝deepcopy。


 1 import copy
 2 l1 = [1,2,3,['barry','alex']]
 3 l2 = copy.deepcopy(l1)
 4 
 5 print(l1,id(l1))  # [1, 2, 3, ['barry', 'alex']] 2915377167816
 6 print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2915377167048
 7 
 8 l1[1] = 222
 9 print(l1,id(l1))  # [1, 222, 3, ['barry', 'alex']] 2915377167816
10 print(l2,id(l2))  # [1, 2, 3, ['barry', 'alex']] 2915377167048
11 
12 l1[3][0] = 'wusir'
13 print(l1,id(l1[3]))  # [1, 222, 3, ['wusir', 'alex']] 2915377167240
14 print(l2,id(l2[3]))  # [1, 2, 3, ['barry', 'alex']] 2915377167304

View Code

对于深copy来说,两个是完全独立的,改变任意一个的任何元素(无论多少层),另一个绝对不改变。


用户评论
开源开发学习小组列表