Python拉链法和开地址法实现字典
Python字典(dictionary)是除列表之外python中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
在列表中使用下标索引可以快速的得到对应的值,那么我们需要做的有两件事情:
- 怎样把键计算出一个唯一值
- 怎样把这个唯一值均匀并且唯一的分布在长度固定的列表中
怎样把键计算出一个唯一值
因为字典的键是不可变的,可hash的,因此我们可以用hash函数计算key对应的唯一hash值。
怎样把这个唯一值均匀并且唯一的分布在长度固定的列表中
hash散列是可以把大数据集映射到定长数据集的算法,因此我们可以对上述计算出来的hash值进行散列。很明显散列之后会出现散列冲突。因此我们需要处理这种冲突一遍唯一值能够均匀唯一的分布。这个时候就有两种处理散列冲突的方法:拉链法和开地址法
拉链法
把具有相同散列地址的k,v
对放在同一个单链表中。下面实现两个函数
put
函数:put(slots, key, value)
,用来向字典中插入数据get
函数:get(slots, key)
,用来从字典中读取数据。
还可以实现更多的函数,比如dict.keys()
下面将这两个函数封装成类
封装成类之后,使用方法和Python提供的dict
就比较像了
开地址法
Python字典内部实现时处理散列冲突的方法就是开地址法,开地址法在后续补充