Python合并两个字典成一个新字典的几种方法分析比较

两个字典如下:

1
2
>>> d1 = {'name' : 'revotu', 'age' : 99}
>>> d2 = {'age' : 24, 'sex' : 'male'}

合并后的结果如下(即,key相同时后面字典值覆盖前面字典):

1
2
>>> d
{'sex': 'male', 'name': 'revotu', 'age': 24}

首先,说明字典并不支持+加法运算:

1
2
3
4
5
>>> d1 + d2
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for +: 'dict' and 'dict'
>>>

现总结如下几种方法以及简要分析比较。

方法一:多次更新

下面是最简单的合并字典的方式:

1
2
3
>>> d = {}
>>> d.update(d1)
>>> d.update(d2)

首先创建一个空字典,并使用update方法向字典中添加元素。注意,先添加的是d1,以保证后面添加的d2重复键会覆盖d1。

此方法满足了我们的要求,而且清晰明确,可是三行代码总感觉不够Pythonic。

方法二:先复制,后更新

先复制d1字典创建一个新字典,然后使用d2来更新前面创建的新字典。

1
2
>>> d = d1.copy()
>>> d.update(d2)

对比方法一,这种复制d1的方法,更明显的表现出d1作为默认值。

方法三:字典构造器

还可以使用字典的构造器dict()复制字典,然后再更新:

1
2
>>> d = dict(d1)
>>> d.update(d2)

与方法二很相似,但是没有方法二直接明了。

方法四:关键字参数hack

你可能见过下面这个巧妙的解决办法:

1
>>> d = dict(d1 , **d2)

只有一行代码,看上去很酷,但是有一个问题,这种hack技巧只有在字典的键是字符串时才有效。

看上去很cool,但是不通用,字典的键必须是字符串才可以用这种关键字参数方法。

方法五:字典推导式

可以用字典推导式解决此问题:

1
>>> d = {k:v for d in [d1, d2] for k,v in d.items()}

字典推导式方法满足要求,只是嵌套的字典推导式,不那么清晰,不易于理解。

方法六:元素拼接

我们从每个字典中获取一个元素列表,将列表拼接起来,然后再用拼接的列表构造字典:

1
>>> d = dict(list(d1.items()) + list(d2.items()))

而且,d2的元素在列表后面,所以在键重复时可以覆盖d1。如果在Python2中,items()方法本身返回的就是列表,无需用list()转成列表。

元素拼接在构造字典可以满足要求,只是看上去代码有些重复。

方法七:元素并集

在Python3中,字典返回的是视图对象,键的视图对象是一个类似集合的对象,如果字典中的值可以保证是唯一的可哈希的,此时items返回的视图对象也是一个类似集合的对象:

1
>>> d = dict(d1.items() | d2.items())

这种方法挺有意思,可是并不准确,因为集合是无序的,键重复时不能保证谁覆盖谁,而且字典中的值通常也是不可哈希的,当然也就不能返回一个类似集合的对象。

方法八:chain items

目前为止,我们讨论的解决方案中,最符合Python语言习惯而且只有一行代码实现的,是创建两个items的列表,然后拼接成字典。
我们可以用itertools.chain来简化items拼接过程:

1
>>> d = dict(chain(d1.items(), d2.items()))

这种方案很不错,可能比另外创建两个不必要的列表更高效。

方法九: ChainMap

collections.ChainMap可以将多个字典或映射,在逻辑上将它们合并为一个单独的映射结构:

1
2
>>> from collections import ChainMap
>>> d = dict(ChainMap(d1, d2))

这种方法也很pythonic,而且也是通用方法。

方法十:字典拆分

在Python3.5+中,可以使用一种全新的字典合并方式:

1
>>> d = {**d1, **d2}

这行代码很pythonic,如果是你的python版本是3.5+,用这种方法是很不错的选择。

总结

上面说了十种可以合并两个字典成一个新字典的方式,具体用哪个取决于你。
如果使用的是Python3.5+的版本,那么字典拆分这种新语法应该很适合你:

1
>>> d = {**d1, **d2}

大师兄 wechat
欢迎关注我的微信公众号:Python大师兄