Python数据类型-字典(dict)介绍
阅读量:次 Authors: 阳哥 TUTORIALS
tutorials-python-basic
阅读量:次 Authors: 阳哥 TUTORIALS
tutorials-python-basic
Python基础-Python数据类型-字典(dict)介绍
Table of Contents
大家好,我是阳哥。
字典(dict)是 python 中的基础数据类型之一,字典的设计并不复杂,我们经常会用到这种数据类型。
同时,字典也有一些比较实用的情景。
学习任何一种编程语言,基础数据类型都是必备的底层基础,今天,我们来学习下 Python 中字典的使用。
主要内容包括:
字典的基本用法
字典推导式
嵌套字典
在 Python 中,字典是一种可以将相关的两个信息关联起来的操作,并且字典可存储的信息量几乎不受限制。
字典是 Python 提供的一种常用的数据结构,它用于存放具有映射关系的数据。为了保存具有映射关系的数据,Python 提供了字典,字典相当于保存了两组数据,其中一组数据是关键数据,被称为 key;另一组数据可通过 key 来访问,被称为 value。
字典是以 key、value 的形式创建的。
字典的每个键值 key=>value
对用冒号 :
分割,每个键值对之间用逗号 ,
分割,整个字典包括在花括号 {}
中 ,格式如下所示:
d = {key1 : value1, key2 : value2 }
一般情况下,字典的创建可以有以下几种方式:
# 创建一个空的字典
my_dict1 = {}
# 创建 key 值为整数的字典
my_dict2 = {1: 'apple', 2: 'ball'}
# 创建 key 值为 string 的字典
my_dict3 = {'name1': 'apple', 'name2': 'ball'}
# 创建 key 值为 数字 和 string 混合的字典
my_dict4 = {'name': 'apple', 1: [2, 4, 3]}
# 用 dict() 函数创建字典
my_dict5 = dict({1:'apple', 2:'ball'})
# 以元组的形式组成序列创建字典
my_dict6 = dict([(1,'apple'), (2,'ball')])
print('my_dict1:', my_dict1)
print('my_dict2:', my_dict2)
print('my_dict3:', my_dict3)
print('my_dict4:', my_dict4)
print('my_dict5:', my_dict5)
print('my_dict6:', my_dict6)
结果如下:
my_dict1: {}
my_dict2: {1: 'apple', 2: 'ball'}
my_dict3: {'name1': 'apple', 'name2': 'ball'}
my_dict4: {'name': 'apple', 1: [2, 4, 3]}
my_dict5: {1: 'apple', 2: 'ball'}
my_dict6: {1: 'apple', 2: 'ball'}
也可以通过下面的方式来创建空白字典
# 创建空白字典的另一种方式
my_dict7 = dict()
# print('my_dict7:', my_dict7)
my_dict7
结果如下:
{}
获取字典中的元素,可以直接通过 key 值来获取对应的 value,如下:
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]}
print(my_dict8['name'])
print(my_dict8.get('name'))
结果如下:
John
John
请注意,如果字典的key值中没有该元素,则不能获取相应的 value,这种情况下产生错误。
print(my_dict8['name1'])
结果如下:
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input-4-eedb02e2ace8> in <module>
----> 1 print(my_dict8['name1'])
KeyError: 'name1'
通过 value 来获取 key 值,在 Python 中并没有提供直接的方法,我们可以通过自定义函数来实现,如下:
def get_keys(d, value):
return [k for k,v in d.items() if v == value]
函数中,d 是字典。
在字典中,可以修改已有 key 对应的 value 值,或者添加新的 key-value 键值对数据,如下:
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]}
# 修改已有 key 对应的 value 的值
my_dict8['age'] = 98
# 添加新的 key-value 数据组
my_dict8['gender'] = 'man'
my_dict8
结果如下:
{'name': 'John', 'age': 98, 1: [2, 4, 3], 'gender': 'man'}
从字典中删除元素,或者删除整个字典,有以下一些方式。
移除字典数据pop()方法的作用是:删除指定给定键所对应的值,返回这个值并从字典中把它移除。
# 使用 pop()方法来删除
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]}
my_dict8.pop('age')
my_dict8
结果如下:
{'name': 'John', 1: [2, 4, 3]}
# 使用 del 方法来删除
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3]}
del my_dict8['name']
my_dict8
结果如下:
{'age': 25, 1: [2, 4, 3]}
# 使用 popitem()方法来删除
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3],
'gender': 'man', 'school': 'UCI', 'city': 'NewYork'}
my_dict8.popitem()
my_dict8
结果如下:
{'name': 'John', 'age': 25, 1: [2, 4, 3], 'gender': 'man', 'school': 'UCI'}
关于 popitem() 方法:
在Python 3.5版本以及之前的时候,使用 popitem() 可能是随机删除的,但我曾经用的 Python3.6版本,好像不是随机删除的,是删除的最后一项。
从 Python 3.7 版本开始,使用 popitem() 方法是删除最后一项,因为字典默认是记住了顺序的:
Ordered dictionaries are just like regular dictionaries but have some extra capabilities relating to ordering operations. They have become less important now that the built-in dict class gained the ability to remember insertion order (this new behavior became guaranteed in Python 3.7).
另外,我查阅了一下 Python3.7 版本中的描述,如下:
popitem()
Remove and return a (key, value) pair from the dictionary. Pairs are returned in LIFO order.
popitem() is useful to destructively iterate over a dictionary, as often used in set algorithms. If the dictionary is empty, calling popitem() raises a KeyError.
Changed in version 3.7: LIFO order is now guaranteed. In prior versions, popitem() would return an arbitrary key/value pair.
https://docs.python.org/3/library/stdtypes.html#mapping-types-dict
在 Python3.7 版本中,是按照 LIFO 的原则进行删除的,是有序进行删除的。
LIFO (Last-in, first-out)即后进来的先删除(也可理解为按后面往前的排序进行删除)
clear()方法是用来清除字典中的所有数据,因为是原地操作,所以返回 None
(也可以理解为没有返回值)
# 使用 clear()方法来清空字典中的所有数据,返回的是一个空字典
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
my_dict8.clear()
my_dict8
结果如下:
{}
del 方法可以删除字典中指定 key 值的内容。
另外, del 可以删除整个字典,与 clear() 方法的清空字典中所有数据是不一样的。演示如下:
使用 del方法是删除字典中指定 key 值对应的内容
# 使用 del方法是删除字典中指定 key 值对应的内容
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
del my_dict8['age']
my_dict8
结果如下:
{'name': 'John', 1: [2, 4, 3], 'gender': 'man'}
使用 del方法是删除整个字典,删除后,再运行程序,会报错误
# 使用 del方法是删除整个字典,删除后,再运行程序,会报错误
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
del my_dict8
my_dict8
结果如下:
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
<ipython-input-11-3d2a02242727> in <module>
4 del my_dict8
5
----> 6 my_dict8
NameError: name 'my_dict8' is not defined
Python字典包含了以下内置函数:
序号 | 函数及描述 |
---|---|
len(dict) | 计算字典元素个数,即键的总数。 |
str(dict) | 输出字典可打印的字符串表示。 |
type(variable) | 返回输入的变量类型,如果变量是字典就返回字典类型。 |
my_dict6 = dict([(1,'apple'), (2,'ball')])
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
print(len(my_dict8))
print(str(my_dict6))
print(type(my_dict8))
结果如下:
4
{1: 'apple', 2: 'ball'}
<class 'dict'>
Python字典包含以下一些方法:
函数 | 函数描述 |
---|---|
clear() | 删除字典内所有元素,返回空字典 |
copy() | 返回一个字典的浅复制 |
fromkeys(seq[, val]) | 创建一个新字典,以序列 seq 中元素做字典的键,val 为字典所有键对应的初始值 |
get(key, default=None) | 返回指定键的值,如果值不在字典中返回 default 值 |
items() | 以列表返回可遍历的(键, 值) 元组数组 |
keys() | 以列表返回一个字典所有的键 |
setdefault(key, default=None) | 和 get()类似, 但如果键不存在于字典中,将会添加键并将值设为 default |
update(dict2) | 把字典 dict2 的键/值对更新到 dict里 |
values() | 以列表返回字典中的所有值 |
pop(key[,default]) | 删除字典给定键 key 所对应的值,返回值为被删除的值。 key 值必须给出。 否则,返回 default值。 |
popitem() | 随机返回并删除字典中的一对键和值。 Python 3.6及以后版本,以 LIFO 的原则进行删除的,是有序进行删除的。 |
clear(), get(), pop(), popitem() 等在上面已介绍的方法,这里不做重复,仅演示其他方法的使用。
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
print('copy:', my_dict8.copy())
print('keys:', my_dict8.keys())
print('values:', my_dict8.values())
print('items:', my_dict8.items())
结果如下:
copy: {'name': 'John', 'age': 25, 1: [2, 4, 3], 'gender': 'man'}
keys: dict_keys(['name', 'age', 1, 'gender'])
values: dict_values(['John', 25, [2, 4, 3], 'man'])
items: dict_items([('name', 'John'), ('age', 25), (1, [2, 4, 3]), ('gender', 'man')])
通过 update 方法,可以更新字典的数据内容:
my_dict6 = {'name': 'Lemon', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
my_dict8.update(my_dict6)
my_dict8
结果如下:
{'name': 'Lemon', 'age': 25, 1: [2, 4, 3], 'gender': 'man'}
fromkeys()方法的演示如下:
请注意,该结果与 zip() 方法之后的结果是不一样的。
seq = ['name', 'age', 'city']
value = ['Lemon', 18, 'cs']
my_dict9 = dict.fromkeys(seq, value)
my_dict9
结果如下:
{'name': ['Lemon', 18, 'cs'],
'age': ['Lemon', 18, 'cs'],
'city': ['Lemon', 18, 'cs']}
zip()方法
seq = ['name', 'age', 'city']
value = ['Lemon', 18, 'cs']
my_dict10 = dict(zip(seq, value))
my_dict10
结果如下:
{'name': 'Lemon', 'age': 18, 'city': 'cs'}
dict.setdefault(key, default=None)
该方法接收两个参数,第一个参数是健的名称,第二个参数是默认值。
假如字典中不存在给定的键,则把默认值赋值给对应的value,并返回默认值;
反之,不修改value,只返回value。
my_dict8 = {'name': 'John', 'age': 25 , 1: [2, 4, 3], 'gender': 'man'}
print('字典中存在的key,返回对应value:', my_dict8.setdefault('age', 0))
print('字典中不存在的key,返回默认值:', my_dict8.setdefault('age1', 0))
结果如下:
字典中存在的key,返回对应value: 25
字典中不存在的key,返回默认值: 0
此外,还可以用 setdefault() 方法统计一个列表里单词出现的次数:
# 用 setdefault() 方法统计一个列表里单词出现的次数
strings = ('Lemon', 'kitten', 'Lemon', 'Lemon',
'lemon_zs', 'Lemon', 'Lemon', 'lemon_zs')
counts = {}
for kw in strings:
counts[kw] = counts.setdefault(kw, 0) + 1
counts
结果如下:
{'Lemon': 5, 'kitten': 1, 'lemon_zs': 2}
字典推导式的一般表达式如下:
{key: value for (key, value) in iterable}
有些用法与列表推导式是类似的,可以参考下面的内容:
用字典推导式的方法创建字典:
my_dict01 = {x: x*x for x in range(6)}
my_dict01
结果如下:
{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25}
通过两个list创建字典:
keys = ['name', 'age', 'city']
values = ['Lemon', 18, 'cs']
my_dict02 = {k:v for (k,v) in zip(keys,values)}
my_dict02
结果如下:
{'name': 'Lemon', 'age': 18, 'city': 'cs'}
在特定条件下,用字典推导式的方法创建字典:
my_dict03 = {x: x*x for x in range(10) if x%2==0}
my_dict03
结果如下:
{0: 0, 2: 4, 4: 16, 6: 36, 8: 64}
字典是以 key、value 的形式创建的, 而嵌套型的字典有一个特征,就是 key 对应的 value 值也可以是一个字典。最简洁的嵌套型字典如下:
d = {key1 : {key3 : value3},
key2 : {key4 : value4} }
nested_dict01 = {1: {'name':'Lemon', 'age': '18', 'city':'cs'},
2: {'name':'Lemon_zs', 'age': '18', 'city':'changsha'}}
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'},
2: {'name': 'Lemon_zs', 'age': '18', 'city': 'changsha'}}
上述的嵌套型字典中,字典第一层的 key 分别是 1 和 2, 而他们对应的 value 值又是都是字典, 里面的字典的 key 都是 “name”, “age” 和 “city”, 但对应的 value 不一样。
从嵌套型字典中获取元素,跟从 list, 以及数组中获取元素时有些类似的。
嵌套型字典 用 []
进行不同层级元素的获取。
nested_dict01 = {1: {'name':'Lemon', 'age': '18', 'city':'cs'},
2: {'name':'Lemon_zs', 'age': '18', 'city':'changsha'}}
print(nested_dict01[1]['name'])
print(nested_dict01[2]['city'])
结果如下:
Lemon
changsha
针对嵌套型字典,同样是可以更新、增加或删除元素的.
增加一个空的字典
nested_dict01 = {1: {'name':'Lemon', 'age': '18', 'city':'cs'},
2: {'name':'Lemon_zs', 'age': '18', 'city':'changsha'}}
# 增加一个空的字典
nested_dict01[3] = {}
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'},
2: {'name': 'Lemon_zs', 'age': '18', 'city': 'changsha'},
3: {}}
修改或增加新的元素
# 修改元素内容
nested_dict01[2]['age'] = '26'
# 增加新的元素
nested_dict01[3]['name'] = 'zws'
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'},
2: {'name': 'Lemon_zs', 'age': '26', 'city': 'changsha'},
3: {'name': 'zws'}}
在嵌套型字典中直接添加一个字典
# 在嵌套型字典中直接添加一个字典
nested_dict01[5]={'name': 'rx', 'age':'3', 'city':'ly'}
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'},
2: {'name': 'Lemon_zs', 'age': '26', 'city': 'changsha'},
3: {'name': 'zws'},
5: {'name': 'rx', 'age': '3', 'city': 'ly'}}
删除某个具体元素内容
# 删除某个具体元素内容
del nested_dict01[5]['city']
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'},
2: {'name': 'Lemon_zs', 'age': '26', 'city': 'changsha'},
3: {'name': 'zws'},
5: {'name': 'rx', 'age': '3'}}
删除嵌套字典里面的某个字典
# 删除嵌套字典里面的某个字典
del nested_dict01[5]
nested_dict01
结果如下:
{1: {'name': 'Lemon', 'age': '18', 'city': 'cs'},
2: {'name': 'Lemon_zs', 'age': '26', 'city': 'changsha'},
3: {'name': 'zws'}}
for main_id, main_info in nested_dict01.items():
print('\nmain id: ', main_id)
for key in main_info:
print(key+':', main_info[key])
结果如下:
main id: 1
name: Lemon
age: 18
city: cs
main id: 2
name: Lemon_zs
age: 26
city: changsha
main id: 3
name: zws
用 pprint
可以使字典显示层次更清晰,需要安装 pprint,安装命令如下:
pip install pprint
演示如下:
# 需要安装 pprint
# pip install pprint
# pprint 可以使字典显示层次更清晰
import pprint
menu = {'dinner':{'chicken':'good','beef':'average',
'vegetarian':{'tofu':'good',
'salad':{'caeser':'bad',
'italian':'average'}},
'pork':'bad'}}
pprint.pprint(menu)
结果如下:
{'dinner': {'beef': 'average',
'chicken': 'good',
'pork': 'bad',
'vegetarian': {'salad': {'caeser': 'bad', 'italian': 'average'},
'tofu': 'good'}}}
可能有些疑惑,字典嵌套这么多层,在哪些地方可以用呢?
这里分享一个用途。嵌套型字典,经常在机器学习中的决策树算法中涉及到。
比如下面的 menu, 是一个字典。 它也可以用树的形式显示出来,这在 决策树中会经常用到。
menu = {'dinner':{'chicken':'good','beef':'average',
'vegetarian':{'tofu':'good',
'salad':{'caeser':'bad',
'italian':'average'}},
'pork':'bad'}}
示例:
from sklearn.tree import DecisionTreeClassifier, export_graphviz
from sklearn import tree
from sklearn.datasets import load_wine
from IPython.display import SVG
from graphviz import Source
from IPython.display import display
# load dataset
data = load_wine()
# feature matrix
X = data.data
# target vector
y = data.target
# class labels
labels = data.feature_names
# print dataset description
# print(data.DESCR)
estimator = DecisionTreeClassifier()
estimator.fit(X, y)
graph = Source(tree.export_graphviz(estimator, out_file=None
, feature_names=labels, class_names=['0', '1', '2']
, filled = True))
display(SVG(graph.pipe(format='svg')))
可视化效果如下:
以上就是 python 中关于字典使用的基础内容,在实践中,咱们还会大量应用到字典。相对来说,嵌套字典会比较复杂些。当我们熟练使用字典的基本方法时,还是可以应对这些问题的。
有时候,也会有一些比较独特的字典,比如 key-value 键值对中的 value 是 pandas 中的 dataframe ,其基础原理,一些常用的方法还是一样的。
« Previous Next »