字典(dict)
字典的实现原理
列表可以理解为数组,那么字典可以理解为关联数组。
字典的实现原理和查字典是类似的。但我们在字典中查找某个字时,一种办法是从字典的第一页开始往后翻,知道找到我们要查找的字为止。这种办法就是在列表中查找元素的办法,其缺点是:字典中的字数越多查找效率就越低。第二种办法是现在字典的索引表里(比如部首表)查找这个字对应的页码,然后直接翻到这个字对应的页,其优点是:查找效率不会随着字典中字数的增加而降低,无论查找那个字,查找速度都非常快。
字典的特点
- 字典中的所有元素都是一个key-value对,通过指定的key总能映射到唯一确定的value。
- 字典中不可以存在重复的key,但是可以存在重复的value。
- 字典中的元素是无序的,顺序不重要,重要的是key和value的映射关系。
- 字典中的key必须是不可变对象,存储字典中的key-value对时,系统会调用内置函数hash根据指定的key计算出value的存储位置,也就是哈希值。对于指定的key,为了保证每次计算出的hash值都是相同的,要求key必须是不可变对象,也就是说,只有不可变对象才能存在哈希值。
- 字典可以根据需要动态的伸缩,系统会根据需要动态的分配和回收内存。因此在使用前无需预先声明字典的容量。
- 字典会浪费比较大的内存,与列表相比,字典就是用空间换取了时间。
字典-创建
花括号
print({'name': 'Jack', 'age': 18}) # {'name': 'Jack', 'age': 18}
# 空字典
print({}) # {}
内置函数dict
print(dict(name= 'Jack', age= 18))
print(dict({'name': 'Jack', 'age': 18}))
print(dict([('name','Jack'),('age',18)]))
print(dict(zip(range(3), 'ABC')))
返回结果如下:
{'name': 'Jack', 'age': 18}
{'name': 'Jack', 'age': 18}
{'name': 'Jack', 'age': 18}
{0: 'A', 1: 'B', 2: 'C'}
dict的方法fromKeys
调用该方法时通过参数指定所有的key,所有的value的默认值都是None
调用该方法时可以通过参数指定所有value的值
print(dict.fromkeys(['name', 'age'])) # {'name': None, 'age': None}
print(dict.fromkeys(('name', 'age'))) # {'name': None, 'age': None}
print(dict.fromkeys(['name', 'age'], 'N/A')) # {'name': 'N/A', 'age': 'N/A'}
字典-查
在字典中根据指定的key查找对应的value,常见的方法如下
使用中括号
d = {'name': 'Jack', 'age': 18}
print(d['name']) # Jack
# 如果字典中不存在指定的key,会抛出KeyError
调用方法get
d = {'name': 'Jack', 'age': 18}
print(d.get('name')) # Jack
# 如果字典中不存在指定的key,并不会抛出KeyError,而是返回None
print(d.get('aaa')) # None
# 可以通过参数设置默认的value,以便在字典中不存在指定的key时将其返回
print(d.get('aaa','cvcc')) # cvcc
# 此外,可以使用运算符in(not)检查字典中是否存在(不存在)指定的key
print('name' in d) # True
print('aaa' in d) # False
print('name' not in d) # False
print('aaa' not in d) # True
字典-改
如果想要修改字典中指定的key对应的value,常见方式有两种:
为已经存在的key赋予一个新的value值(一次只修改一个key对应的value0)
d = {'name': 'Jack', 'age': 18, 'gender': '男'}
d['age'] = 20
print(d) # {'name': 'Jack', 'age': 20, 'gender': '男'}
调用方法update(一次至少修改一个key对应的value)
d = {'name': 'Jack', 'age': 18, 'gender': '男'}
d.update(name = 'Mike', age = 20)
print(d) # {'name': 'Mike', 'age': 20, 'gender': '男'}
字典-增
如果想往字典中添加key-value时,常见的方式有两种:
为不存在的key赋予一个value值(一次只添加一个key-value对)
d = {'name': 'Jack', 'age': 18}
d['gender'] = '男'
print(d) # {'name': 'Jack', 'age': 18, 'gender': '男'}
调用方法update(一次至少添加一个key-value对)
d = {'name': 'Jack', 'age': 18}
d.update(gender = '男', score = 90)
print(d) # {'name': 'Jack', 'age': 18, 'gender': '男', 'score': 90}
字典-删
调用方法pop(一次只删除一个指定key的key-value对)
该方法返回指定的key对应的value
d = {'name': 'Jack', 'age': 18, 'gender': '男'}
print(d.pop('age')) # 18
print(d) # {'name': 'Jack', 'gender': '男'}
# 如果指定的key不存在,会抛出KeyError
# 为了防止抛出KeyError的情况,可以通过参数指定一个默认返回的value
print(d.pop('aaa', 90)) # 90
使用del语句(一次只删除一个指定key的key-value对)
d = {'name': 'Jack', 'age': 18, 'gender': '男'}
del d['age']
print(d) # {'name': 'Jack', 'gender': '男'}
调用方法popitem(一次只删除一个任意的key-value对)
该方法返回被删除的key-value对
d = {'name': 'Jack', 'age': 18, 'gender': '男'}
print(d.popitem()) # ('gender', '男')
print(d) # {'name': 'Jack', 'age': 18}
调用方法clear(清空字典)
d = {'name': 'Jack', 'age': 18, 'gender': '男'}
d.clear()
print(d) # {}
字典-视图
得到字典相关视图有如下三个方法:
- keys:返回字典所有key的视图
- values:返回字典所有value的视图
- items:返回字典所有key-value对的视图
d = {'name': 'Jack', 'age': 18, 'gender': '男'}
print(d.keys()) # dict_keys(['name', 'age', 'gender'])
print(list(d.keys())) # ['name', 'age', 'gender']
print(d.values()) # dict_values(['Jack', 18, '男'])
print(list(d.values())) # ['Jack', 18, '男']
print(d.items()) # dict_items([('name', 'Jack'), ('age', 18), ('gender', '男')])
print(list(d.items())) # [('name', 'Jack'), ('age', 18), ('gender', '男')]
为字典中指定的key设置默认值
为了确保字典中指定的key总是存在的,可以调用方法setdefault:
- 如果字典中存在指定的key,该方法返回指定的key对应的value,字典不发生变化。
- 如果字典中不存在指定的key,该方法返回指定的默认value值,字典中添加一个key-value对:"指定的key: 指定的默认value值",此时,调用方法setdefault相当于语句:if ... not in ...。
d = {'name': 'Jack'}
print(d.setdefault('name', 'defaultName')) # Jack
print(d) # {'name': 'Jack'}
d = {}
print(d.setdefault('name', 'defaultName')) # defaultName
print(d) # {'name': 'defaultName'}
借助字典创建格式化字符串
使用百分号作为占位符
phonebook = {'张三': '1333333333',
'李四': '1444444444',
'王五': '1555555555',
'赵六': '1666666666'}
# 王五的号码:1555555555,张三的号码:1333333333
print('王五的号码:%s,张三的号码:%s' % (phonebook['王五'], phonebook['张三']))
当定义的格式化字符串中的占位符是百分号,并且占位符对应的实际值来自某个字典的value时,可以把所有的实际值改写为字典,同时根据字典的value对应的key在占位符%的后面添加:(字典的key).其中,字典的key会被添加一对引号,因此,如果字典的key是字符串,需要去掉字典的key自带的引号。
phonebook = {'张三': '1333333333',
'李四': '1444444444',
'王五': '1555555555',
'赵六': '1666666666'}
# 王五的号码:1555555555,张三的号码:1333333333
print('王五的号码:%(王五)s,张三的号码:%(张三)s' % phonebook)
使用花括号作为占位符
phonebook = {'张三': '1333333333',
'李四': '1444444444',
'王五': '1555555555',
'赵六': '1666666666'}
# 王五的号码:1555555555,张三的号码:1333333333
print('王五的号码:{},张三的号码:{}'.format(phonebook['王五'],phonebook['张三']))
当定义的格式化字符串中的占位符是花括号,并且占位符对应的实际值来自某个字典的value时,可以调用方法format_map并把该字典直接作为方法的参数,同时根据字典的value在花括号中指定对应的key:{字典的key}。其中,字典的key会被添加一对引号,因此,如果字典的key是字符串,需要去掉字典的key自带的引号。
phonebook = {'张三': '1333333333',
'李四': '1444444444',
'王五': '1555555555',
'赵六': '1666666666'}
# 王五的号码:1555555555,张三的号码:1333333333
print('王五的号码:{王五},张三的号码:{张三}'.format_map(phonebook))
集合(set)
可以把集合看做是没有存储value的字典
集合的特点
- 集合中不可以存储重复的数据
- 集合中的数据是无序的
- 集合中的数据可以是任何不可变的类型,多种类型的数据可以混合存储在一个集合中
- 集合可以根据需要动态的伸缩,也就是说,系统会根据需要动态的分配和回收内存,因此,在使用前无需预先声明集合的容量
- 集合会浪费比较大的内存,与列表相比,用空间换取时间
集合-创建
使用花括号
将创建的集合赋值给变量时,变量名不要取set,因为set是集合对应的类名。
s = {1, 6, 3, 4, 5}
print(type(s)) # <class 'set'>
# 可以看出,输出集合时,会进行排序
print(s) # {1, 3, 4, 5, 6}
# 集合中重复的元素会被抹除
print({1, 3, 4, 3, 5, 5, 11, 7}) # {1, 3, 4, 5, 7, 11}
# 不能使用{}表示空集合,因为{}表示空字典
print(type({})) # <class 'dict'>
调用内置函数set
print(set(range(1,6))) # {1, 2, 3, 4, 5}
print(set([3, 4, 5, 1])) # {1, 3, 4, 5}
print(set((3, 4, 5, 1))) # {1, 3, 4, 5}
print(set('3451')) # {'5', '3', '1', '4'}
print(set({3, 4, 5, 1})) # {1, 3, 4, 5}
# 空集合
print(set()) # set()
集合间的关系
两个集合是否相等
可以使用运算符==和!=进行判断
s1 = {1, 3, 5, 7, 9}
s2 = {3, 7, 9, 5, 1}
print(s1 == s2) # True
print(s1 != s2) # False
一个集合是否是另外一个集合的子集
可以调用方法issubset进行判断
s1 = {1, 3, 5, 7, 9}
s2 = {2, 3, 6, 7, 10}
s3 = {1, 3, 5, 6, 7, 9}
print(s1.issubset(s2)) # False
print(s1.issubset(s3)) # True
一个集合是否是另外一个集合的超集
可以调用方法issuperset进行判断
s1 = {1, 3, 5, 7, 9}
s2 = {2, 3, 6, 7, 10}
s3 = {1, 3, 5, 6, 7, 9}
print(s2.issuperset(s1)) # False
print(s3.issuperset(s1)) # True
两个集合是否没有交集
可以调用方法isdisjoint判断
s1 = {1, 3, 5, 7, 9}
s2 = {2, 3, 6, 7, 10}
s3 = {2, 4, 6, 8, 10}
print(s1.isdisjoint(s2)) # False
print(s1.isdisjoint(s3)) # True
集合-数学操作
两个集合的交集
调用方法intersection和使用运算符&是等价的。
做交集操作后生成给一个新集合,做交集操作的两个集合不变。
s1 = {1, 3, 5, 7, 9}
s2 = {2, 3, 6, 7, 10}
print(s1.intersection(s2)) # {3, 7}
print(s1 & s2) # {3, 7}
print(s1) # {1, 3, 5, 7, 9}
print(s2) # {2, 3, 6, 7, 10}
# s1.intersection_update(s2) 将交集结果更新s1,s2不变,方法intersection_update的返回值为None
print(s1.intersection_update(s2)) # None
print(s1) # {3, 7}
print(s2) # {2, 3, 6, 7, 10}
两个集合的并集
调用方法union和使用运算符|是等价的。
做并集操作后生成一个新的集合,做并集操作的两个集合不变。
s1 = {1, 3, 5, 7, 9}
s2 = {2, 3, 6, 7, 10}
print(s1.union(s2)) # {1, 2, 3, 5, 6, 7, 9, 10}
print(s1 | s2) # {1, 2, 3, 5, 6, 7, 9, 10}
print(s1) # {1, 3, 5, 7, 9}
print(s2) # {2, 3, 6, 7, 10}
# 不存在方法union_update()
两个集合的差集
调用方法difference和使用运算符-是等价的。
做差集操作后生成一个新集合,做差集操作的两个集合不变。
s1 = {1, 3, 5, 7, 9}
s2 = {2, 3, 6, 7, 10}
print(s1.difference(s2)) # {1, 5, 9}
print(s1 - s2) # {1, 5, 9}
print(s1) # {1, 3, 5, 7, 9}
print(s2) # {2, 3, 6, 7, 10}
# s1.difference_update(s2)将差集结果更新s1,s2不变,此方法返回None
print(s1.difference_update(s2)) # None
print(s1) # {1, 5, 9}
print(s2) # {2, 3, 6, 7, 10}
两个集合的对称差集
调用方法symmetric_difference和使用运算符^是等价的。
做对称差集操作后生成一个新集合,做对称差集操作的两个集合不变。
s1 = {1, 3, 5, 7, 9}
s2 = {2, 3, 6, 7, 10}
print(s1.symmetric_difference(s2)) # {1, 2, 5, 6, 9, 10}
print(s1 ^ s2) # {1, 2, 5, 6, 9, 10}
print(s1) # {1, 3, 5, 7, 9}
print(s2) # {2, 3, 6, 7, 10}
# s1.symmetric_difference_update(s2)将对称差集结果更新s1,s2不变,此方法返回None
print(s1.symmetric_difference_update(s2)) # None
print(s1) # {1, 2, 5, 6, 9, 10}
print(s2) # {2, 3, 6, 7, 10}
集合-查
可以使用运算符in(not in)检查集合中是否存在(不存在)指定的元素。
s1 = {1, 3, 5, 7, 9}
print(5 in s1) # True
print(5 not in s1) # False
集合-增
调用方法add(一次只添加一个元素)
s = {3, 4, 5, 6, 7}
s.add(8)
print(s) # {3, 4, 5, 6, 7, 8}
# 集合中已经存在的元素不会被添加,切不会抛出异常
s.add(8)
print(s) # {3, 4, 5, 6, 7, 8}
调用方法update(一次至少添加一个元素)
s = {3, 4, 5, 6, 7}
s.update({8, 9})
print(s) # {3, 4, 5, 6, 7, 8, 9}
# 集合中已经存在的元素不会被添加,切不会抛出异常
s.update({8, 9})
print(s) # {3, 4, 5, 6, 7, 8, 9}
集合-删
调用方法remove(一次只删除一个指定的元素)
s = {3, 4, 5, 6, 7}
s.remove(5)
print(s) # {3, 4, 6, 7}
# 如果指定的元素在集合中不存在,抛出KeyError
调用方法discard(一次只删除一个指定的元素)
s = {3, 4, 5, 6, 7}
s.discard(5)
print(s) # {3, 4, 6, 7}
# 如果指定的元素在集合中不存在,不会抛出异常
s.discard(1)
print(s) # {3, 4, 6, 7}
调用方法pop(一次只删除一个任意的元素)
该方法会返回被删除的元素
s = {3, 4, 5, 6, 7}
print(s.pop()) # 3
print(s) # {4, 5, 6, 7}
调用方法clear(清空集合)
s = {3, 4, 5, 6, 7}
s.clear()
print(s) # set()
不可变集合frozenset
frozenset意思是被冻结的set,也就是不可变的set。
frozenset是不可变类型,所有forzenset类型的对象:
- 存在哈希值
- 可以作为字典的key
- 可以作为set中的元素
可以调用内置函数frozenset来创建frozenset对象
print(frozenset()) # frozenset()
print(frozenset(range(1, 6))) # frozenset({1, 2, 3, 4, 5})
print(frozenset([1, 3, 4, 5])) # frozenset({1, 3, 4, 5})
print(frozenset([1, 3, 4, 5])) # frozenset({1, 3, 4, 5})
print(frozenset('1345')) # frozenset({'4', '1', '5', '3'})
print(frozenset({1, 3, 4, 5})) # frozenset({1, 3, 4, 5})