散列表

作者: zhengqiuliu | 来源:发表于2019-05-06 10:08 被阅读3次

散列表又名哈希表,这种数据结构也是在日常开发中使用非常频繁的数据结构。如Java使用HashMap,TreeMap,LinkedMap,ConcurrentHashMap 等类型都是散列表结构。

一,散列表为什么可以做到基于Key值随机访问?

散列表底层的数据结构依然是数组,如果没有数组就没有散列表。散列表的Key值相当于数组的下标,数组的下标=hash(key),只能是大于等于0的整数。散列表的value值相当于数组下标对应的value数据。所以通过key可以直接获取其对应的value=arr[hash(key)]。

二,该如何构造散列函数,散列函数满足的基本要求?

1,散列函数得到的值应该是一个非负整数。

2,如果key1 = key2 那么 hash(key1) = hash(key2)。

3,如果key1 != key2 那么 hash(key1) != hash(key2)。

上面1和2都比较好理解,对于3要想找到一个不同的key对应散列值都不一样的散列函数,几乎是不可能的。像业界著名的MD5,SHA,CRC等哈希算法,也无法完全避免散列冲突。既然无法避免,那么如何通过其他途径解决。

三,如何解决hash冲突?

目前主要的方法有两种一种是开放寻址法,还一种是链表法

开放寻址法又可以分为:线性探测,二次探测和双重探测。

线性探测:如果往散列表中插入数据时,如果某个数据经过散列函数之后,存储位置已经被占用,那我们从当前位置开始,依次向后寻找,第一次hash(key) + 1,第二次 hash(key) + 2。当哈希表中的数据越来越多,空闲位置越来越少时,出现冲突的可能就越大,最坏情况的时间复杂度=O(n)

二次探测:出现冲突,我们从当前位置开始,第一次hash(key) + 1^2, 第二次hash(key) + 2^2。

双重探测:出现冲突,我们从当前位置开始,使用一组散列函数,第一次hash1(key),第二次hash2(key)。

开放寻址三种方法,当散列表中的空闲位置不多时,散列冲突的概率就会大大提高。一般情况我们会保证散列表中有一定比例的空闲空间,我们使用装载因子表示填入元素的多少。

装载因子 = 填入表中的元素 / 散列表长度


链表法:更加常用的解决散列冲突的办法。在散列表中,每个bucket都会对应一条链表,所有散列值相同的元素我们都放在相同bucket对应的链表中。

当插入一个元素存在冲突,或者删除一个元素时,其时间复杂度是多少呢?

链表的长度k = n/m,n表示散列中数据个数,m表示bucket的个数。所以插入和删除操作的时间复杂度就是O(k)。

相关文章

  • 散列表

    1.啥是散列表及散列函数? 很多语言都提供了散列表的实现方式,python是用dict{ }来实现 2.有啥优势?...

  • 散列表

    基本概念(非严谨) 散列表:按照思考事物本质以及理想状态的思路,那么散列表从本质来讲就是一个表,而理想的散列表应该...

  • 散列表

    散列表:散列技术是在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使得每个关键字key对应一个存储位置f...

  • 散列表

    转载请注明出处!https://www.jianshu.com/p/e325578eb512 链表实现 Githu...

  • 散列表

    一、定义 散列表(Hash Table,也叫哈希表),是通过把键值映射成整数来作为数组的索引,并进行访问记录的一种...

  • 散列表

    https://blog.csdn.net/pcwl1206/article/details/83582986

  • 散列表

    散列查找法的两项基本工作 计算位置:构造散列函数直接确定关键词存储位置散列函数的设计,主要目的是构造随机性:计算简...

  • 散列表

    散列表是一种基本的数据结构,那么散列表到底是什么样的一种数据结构呢?又有哪些应用场景呢? 假如我们要从一本电话本中...

  • 散列表

    散列表 认识散列表 是 字典(键 、值对)的一种实现方式。每次在字典中获取一个值,都需要重复遍历字典,如果用散列表...

  • 散列表

    散列函数将被查找的键转换为数组的索引 解决冲突的方法:拉链法和线性探测法 将整数散列最常见的方法是除留余数法,通常...

网友评论

    本文标题:散列表

    本文链接:https://www.haomeiwen.com/subject/wpploqtx.html