Python在字典中将键映射到多个值上

问题

我们想要一个能将键(key)能映射到多个值的字典(即所谓的一键多值字典multidict)。

解决方案

字典是一种关联容器。每个键都映射到单独的值上。如果想让键映射到多个值,需要将这多个值保存到另一个容器如列表或集合中。例如,可能会像这样创建字典:

1
2
3
4
5
6
7
8
9
d = {
'a' : [1, 2, 3],
'b' : [4, 5]
}
e = {
'a' : {1, 2, 3},
'b' : {4, 5}
}

要使用列表还是集合完全取决于应用的意图。如果希望保留元素插入的顺序,就用列表。如果希望消除重复元素(且不在意它们的顺序),就用集合。
为了能方便的创建这样的字典,可以利用collections模块中的defaultdict类。defaultdict的一个特点就是它会自动初始化第一个值,这样只需关注添加元素即可。例如:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
from collections import defaultdict
d = defaultdict(list)
d['a'].append(1)
d['a'].append(2)
d['a'].append(3)
d['b'].append(4)
d['b'].append(5)
print(d) # outputs : defaultdict(<class 'list'>, {'a': [1, 2, 3], 'b': [4, 5]})
d = defaultdict(set)
d['a'].add(1)
d['a'].add(2)
d['a'].add(3)
d['b'].add(4)
d['b'].add(5)
print(d) # outputs : defaultdict(<class 'set'>, {'a': {1, 2, 3}, 'b': {4, 5}})

关于defaultdict,需要注意的一个地方是,它会自动创建字典表项以待稍后的访问(即使这些表项当前在字典中还没有找到)。例如:

1
2
3
4
5
6
7
from collections import defaultdict
d = defaultdict(list)
if d['a']:
pass
print(d) # outputs : defaultdict(<class 'list'>, {'a': []})

如果不想要这个功能,可以在普通的字典上调用setdefault()方法来取代。例如:

1
2
3
4
5
6
7
8
9
10
from collections import defaultdict
d = {}
d.setdefault('a', []).append(1)
d.setdefault('a', []).append(2)
d.setdefault('a', []).append(3)
d.setdefault('b', []).append(4)
d.setdefault('b', []).append(5)
print(d) # outputs : {'a': [1, 2, 3], 'b': [4, 5]}

然后,总感觉使用setdefault()有点不自然,更别提每次调用它时都会创建一个初始值的新实例了(例子中的空列表[])。

讨论

原则上,构建一个一键多值字典是很容易的。但是试着自己对第一个值做初始化操作,这就会变得很杂乱。例如,可能会写下这样的代码:

1
2
3
4
5
d = {}
for key, value in pairs:
if key not in d:
d[key] = value
d[key].append(value)

使用defaultdict后代码会清晰很多:

1
2
3
d = defaultdict(list)
for key, value in pairs:
d[key].append(value)

大师兄 wechat
欢迎关注我的微信公众号:Python大师兄