更新時(shí)間:2022-08-24 來(lái)源:黑馬程序員 瀏覽量:
一、前言:
面試過(guò)的人都知道,HashMap是Java程序員在面試中最最最經(jīng)常被問(wèn)到的一個(gè)點(diǎn),可以說(shuō),不了解HashMap都不好意思說(shuō)自己是做Java開(kāi)發(fā)的。基本上你去面試十家公司,有七八家都會(huì)問(wèn)到你HashMap。那么今天,就帶著大家從源碼的角度去分析一下,HashMap具體是怎么實(shí)現(xiàn)的。
二、HashMap的構(gòu)造方法
1.HashMap構(gòu)造方法
我們先來(lái)看HashMap的四個(gè)構(gòu)造方法
```java //initialCapacity給定的初始化容量,loadFactor擴(kuò)容因子 public HashMap(int initialCapacity , float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); this.loadFactor = loadFactor; this.threshold = tableSizeFor(initialCapacity); } public HashMap(int initialCapacity) { //內(nèi)部調(diào)用了上邊的構(gòu)造方法 this(initialCapacity, DEFAULT_LOAD_FACTOR); } public HashMap() {//空參構(gòu)造 this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted } public HashMap(Map<? extends K, ? extends V> m) {//構(gòu)造傳入一個(gè)map,將map中的值放到hashmap中 this.loadFactor = DEFAULT_LOAD_FACTOR; putMapEntries(m, false); } ```
2.構(gòu)造方法里的putMapEntries方法
剛才構(gòu)造方法中提到了putMapEntries這個(gè)方法,接下來(lái)就讓我們一起看一下
//該函數(shù)用于將一個(gè)map賦值給新的HashMap final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) { //定義變量接收舊hashmap的size int s = m.size(); //判斷s的容量是否大于0 if (s > 0) { //判斷當(dāng)前數(shù)組有沒(méi)有初始化 if (table == null) { // pre-size ////求出以 舊hashmap數(shù)組容量為閾值 的數(shù)組容量賦值給ft float ft = ((float)s / loadFactor) + 1.0F; //判斷是不是大于最大容量,如果是,賦值為最大容量,否則將ft賦值給t int t = ((ft < (float)MAXIMUM_CAPACITY) ? (int)ft : MAXIMUM_CAPACITY); //判斷t是否大于threshold(數(shù)組擴(kuò)容閾值) if (t > threshold) //通過(guò)tablesizefor方法求出大于等于t的最小2的次冪值賦值給threshold(數(shù)組擴(kuò)容閾值) threshold = tableSizeFor(t); } //如果數(shù)組長(zhǎng)度大于擴(kuò)容閾值,進(jìn)行resize擴(kuò)容操作 else if (s > threshold) resize(); //循環(huán)遍歷取出舊hashmap的值放入當(dāng)前hashmap for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) { K key = e.getKey(); V value = e.getValue(); putVal(hash(key), key, value, false, evict); } } } /* if (table == null)分支,是判斷當(dāng)前數(shù)組是否初始化,因?yàn)樵趈dk1.8之后,只有當(dāng)你第一次放值時(shí),才會(huì)幫你創(chuàng)建16位的數(shù)組。 float ft = ((float)s / loadFactor) + 1.0F經(jīng)過(guò)除運(yùn)算再加上1.0F是為了向上取整 if (t > threshold)注意一個(gè)細(xì)節(jié),做判斷的的時(shí)候,數(shù)組還沒(méi)有初始化,這里的threshold的值還是給定的數(shù)組長(zhǎng)度的值,也就是capacity的值 else if (s > threshold)說(shuō)明傳入的map集合大于當(dāng)前的擴(kuò)容閾值,需要進(jìn)行resize擴(kuò)容操作 */ ```
tableSizeFor方法
剛才putMapEntries方法中,調(diào)用了tableSizeFor方法,接下來(lái)我們看一下這個(gè)tableSizeFor方法。
作用:創(chuàng)建hashMap對(duì)象時(shí)調(diào)用有參構(gòu)造,傳入初始容量,需要保證hashMap的初始長(zhǎng)度為2的n次冪。
tableSizeFor方法用來(lái)計(jì)算大于等于并離傳入值最近的2的n次冪的數(shù)值,比如傳入15,算出結(jié)果為16,傳入17,算出結(jié)果為32。
通過(guò)二進(jìn)制的位移,第一次右移一位,第二次右移兩位,第三次右移四位。。。通過(guò)五次位移,將范圍內(nèi)所有的位數(shù)都變?yōu)?,高位補(bǔ)0,最后得出來(lái)的結(jié)果再加上1,最后算出來(lái)的結(jié)果一定是2的n次冪。
//這個(gè)方法的作用是找到大于等于給定容量的最小2的次冪值 //>>>表示無(wú)符號(hào)右移,也叫邏輯右移,即若該數(shù)為正,則高位補(bǔ)0,而若該數(shù)為負(fù)數(shù),則右移后高位同樣補(bǔ)0 7--》8 16--》16 static final int tableSizeFor(int cap) { //先將數(shù)組長(zhǎng)度減1,之所以在開(kāi)始移位前先將容量-1,是為了避免給定容量已經(jīng)是8,16這樣2的冪時(shí),不減一 直接移位會(huì)導(dǎo)致得到的結(jié)果比預(yù)期大。比如預(yù)期16得到應(yīng)該是16,直接移位的話會(huì)得到32。 int n = cap - 1; //右移一位,在進(jìn)行或運(yùn)算,這個(gè)時(shí)候最高位和次高位就已經(jīng)都是1,此時(shí)是2個(gè)1 n |= n >>> 1; //右移兩位,在進(jìn)行或運(yùn)算,這個(gè)時(shí)候由上次運(yùn)算得出的兩個(gè)1,變成了四個(gè)1 n |= n >>> 2; //右移四位 n |= n >>> 4; //右移八位 n |= n >>> 8; //右移十六位,這個(gè)時(shí)候所有的位數(shù)都變?yōu)榱? n |= n >>> 16; //n+1操作,是為了進(jìn)1,這個(gè)時(shí)候算出來(lái)的數(shù)值就一點(diǎn)是 2的n次冪 return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1; } ```
移位的思想
2的整數(shù)冪用二進(jìn)制表示都是最高有效位為1,其余全是0。
對(duì)任意十進(jìn)制數(shù)轉(zhuǎn)換為2的整數(shù)冪,結(jié)果是這個(gè)數(shù)本身的最高有效位的前一位變成1,最高有效位以及其后的位都變?yōu)?。
核心思想是,先將最高有效位以及其后的位都變?yōu)?,最后再+1,就進(jìn)位到前一位變成1,其后所有的滿2變0。所以關(guān)鍵是如何將最高有效位后面都變?yōu)?。
先移位,再或運(yùn)算。
> 右移一位,再或運(yùn)算,就有兩位變?yōu)?;
>
> 右移兩位,再或運(yùn)算,就有四位變?yōu)?,,,
>
> 最后右移16位再或運(yùn)算,保證32位的int類型整數(shù)最高有效位之后的位都能變?yōu)?。
三、HashMap的底層原理
先來(lái)看幾個(gè)重要的參數(shù):
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // 默認(rèn)數(shù)組初始容量 static final int MAXIMUM_CAPACITY = 1 << 30;//數(shù)組最大容量 static final float DEFAULT_LOAD_FACTOR = 0.75f;//默認(rèn)加載因子 static final int TREEIFY_THRESHOLD = 8;//樹(shù)化的閾值 static final int UNTREEIFY_THRESHOLD = 6;//由樹(shù)退化到鏈表的閾值 static final int MIN_TREEIFY_CAPACITY = 64;//樹(shù)化最小數(shù)組容量 //node節(jié)點(diǎn),繼承了Map.entry,在Entry原有的K,V的基礎(chǔ)上追加了hash和next字段 //分別表示key的hash值和下一個(gè)節(jié)點(diǎn) static class Node<K,V> implements Map.Entry<K,V> { final int hash; final K key; V value; Node<K,V> next; } //重寫了計(jì)算hash的方法 //將 Hash 值的高 16 位右移并與原 Hash 值取異或運(yùn)算(^),混合高 16 位和低 16 位的值 //得到一個(gè)更加散列的低 16 位的 Hash 值。 static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); } ```
HashMap在JDK1.8之前的實(shí)現(xiàn)方式數(shù)組+鏈表,
但是在JDK1.8后對(duì)HashMap進(jìn)行了底層優(yōu)化,改為了由 **數(shù)組+鏈表或者數(shù)值+紅黑樹(shù)**實(shí)現(xiàn),主要的目的是提高查找效率
1. Jdk8數(shù)組+鏈表或者數(shù)組+紅黑樹(shù)實(shí)現(xiàn),當(dāng)鏈表中的元素大于等于8 個(gè)并且數(shù)組長(zhǎng)度大于等于64以后, 會(huì)將鏈表轉(zhuǎn)換為紅黑樹(shù),當(dāng)紅黑樹(shù)節(jié)點(diǎn) 小于 等于6 時(shí)又會(huì)退化為鏈表。
2. 當(dāng)new HashMap()時(shí),底層沒(méi)有創(chuàng)建數(shù)組,首次調(diào)用put()方法示時(shí),會(huì)調(diào)用resize方法,底層創(chuàng)建長(zhǎng)度為16的數(shù)組,jdk8底層的數(shù)組是:Node[],而非Entry[],用數(shù)組容量大小乘以加載因子得到一個(gè)值,一旦數(shù)組中存儲(chǔ)的元素個(gè)數(shù)超過(guò)該值就會(huì)調(diào)用resize方法將數(shù)組擴(kuò)容到原來(lái)的兩倍,在做擴(kuò)容的時(shí)候會(huì)生成一個(gè)新的數(shù)組,原來(lái)的所有數(shù)據(jù)需要重新計(jì)算哈希碼值重新分配到新的數(shù)組,所以擴(kuò)容的操作非常消耗性能。
默認(rèn)的負(fù)載因子大小為0.75,數(shù)組大小為16。也就是說(shuō),默認(rèn)情況下,那么當(dāng)HashMap中元素個(gè)數(shù)超過(guò)16*0.75=12的時(shí)候,就把數(shù)組的大小擴(kuò)展為2*16=32,即擴(kuò)大一倍。
3. 在我們Java中任何對(duì)象都有hashcode,hash算法就是通過(guò)hashcode與自己進(jìn)行向右位移16的異或運(yùn)算。這樣做是為了使高位的16位hash也能參與運(yùn)算,使運(yùn)算出來(lái)的hash值足夠隨機(jī),足夠分散,還有產(chǎn)生的數(shù)組下標(biāo)足夠隨機(jī)。
map.put(k,v)實(shí)現(xiàn)原理:
(1)首先將k,v封裝到Node對(duì)象當(dāng)中(節(jié)點(diǎn))。
(2)先調(diào)用k的hashCode()方法得出哈希值,并通過(guò)哈希算法轉(zhuǎn)換成數(shù)組的下標(biāo)。
(3)下標(biāo)位置上如果沒(méi)有任何元素,就把Node添加到這個(gè)位置上。如果說(shuō)下標(biāo)對(duì)應(yīng)的位置上有鏈表。此時(shí),就會(huì)拿著k和鏈表上每個(gè)節(jié)點(diǎn)的k進(jìn)行equal。如果所有的equals方法返回都是false,那么這個(gè)新的節(jié)點(diǎn)將被添加到鏈表的末尾。如其中有一個(gè)equals返回了true,那么這個(gè)節(jié)點(diǎn)的value將會(huì)被覆蓋。
HashMap中的put()方法
```java public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } ```
putVal()方法。
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; //判斷數(shù)組是否未初始化 if ((tab = table) == null || (n = tab.length) == 0) //如果未初始化,調(diào)用resize方法 進(jìn)行初始化 n = (tab = resize()).length; //通過(guò) & 運(yùn)算求出該數(shù)據(jù)(key)的數(shù)組下標(biāo)并判斷該下標(biāo)位置是否有數(shù)據(jù) if ((p = tab[i = (n - 1) & hash]) == null) //如果沒(méi)有,直接將數(shù)據(jù)放在該下標(biāo)位置 tab[i] = newNode(hash, key, value, null); //該數(shù)組下標(biāo)有數(shù)據(jù)的情況 else { Node<K,V> e; K k; //判斷該位置數(shù)據(jù)的key和新來(lái)的數(shù)據(jù)是否一樣 if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) //如果一樣,證明為修改操作,該節(jié)點(diǎn)的數(shù)據(jù)賦值給e,后邊會(huì)用到 e = p; //判斷是不是紅黑樹(shù) else if (p instanceof TreeNode) //如果是紅黑樹(shù)的話,進(jìn)行紅黑樹(shù)的操作 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); //新數(shù)據(jù)和當(dāng)前數(shù)組既不相同,也不是紅黑樹(shù)節(jié)點(diǎn),證明是鏈表 else { //遍歷鏈表 for (int binCount = 0; ; ++binCount) { //判斷next節(jié)點(diǎn),如果為空的話,證明遍歷到鏈表尾部了 if ((e = p.next) == null) { //把新值放入鏈表尾部 p.next = newNode(hash, key, value, null); //因?yàn)樾虏迦肓艘粭l數(shù)據(jù),所以判斷鏈表長(zhǎng)度是不是大于等于8 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st //如果是,進(jìn)行轉(zhuǎn)換紅黑樹(shù)操作 treeifyBin(tab, hash); break; } //判斷鏈表當(dāng)中有數(shù)據(jù)相同的值,如果一樣,證明為修改操作 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; //把下一個(gè)節(jié)點(diǎn)賦值為當(dāng)前節(jié)點(diǎn) p = e; } } //判斷e是否為空(e值為修改操作存放原數(shù)據(jù)的變量) if (e != null) { // existing mapping for key //不為空的話證明是修改操作,取出老值 V oldValue = e.value; //一定會(huì)執(zhí)行 onlyIfAbsent傳進(jìn)來(lái)的是false if (!onlyIfAbsent || oldValue == null) //將新值賦值當(dāng)前節(jié)點(diǎn) e.value = value; afterNodeAccess(e); //返回老值 return oldValue; } } //計(jì)數(shù)器,計(jì)算當(dāng)前節(jié)點(diǎn)的修改次數(shù) ++modCount; //當(dāng)前數(shù)組中的數(shù)據(jù)數(shù)量如果大于擴(kuò)容閾值 if (++size > threshold) //進(jìn)行擴(kuò)容操作 resize(); //空方法 afterNodeInsertion(evict); //添加操作時(shí) 返回空值 return null; } ```
map中resize方法
//擴(kuò)容、初始化數(shù)組 final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; //如果當(dāng)前數(shù)組為null的時(shí)候,把oldCap老數(shù)組容量設(shè)置為0 int oldCap = (oldTab == null) ? 0 : oldTab.length; //老的擴(kuò)容閾值 int oldThr = threshold; int newCap, newThr = 0; //判斷數(shù)組容量是否大于0,大于0說(shuō)明數(shù)組已經(jīng)初始化 if (oldCap > 0) { //判斷當(dāng)前數(shù)組長(zhǎng)度是否大于最大數(shù)組長(zhǎng)度 if (oldCap >= MAXIMUM_CAPACITY) { //如果是,將擴(kuò)容閾值直接設(shè)置為int類型的最大數(shù)值并直接返回 threshold = Integer.MAX_VALUE; return oldTab; } //如果在最大長(zhǎng)度范圍內(nèi),則需要擴(kuò)容 OldCap << 1等價(jià)于oldCap*2 //運(yùn)算過(guò)后判斷是不是最大值并且oldCap需要大于16 else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold 等價(jià)于oldThr*2 } //如果oldCap<0,但是已經(jīng)初始化了,像把元素刪除完之后的情況,那么它的臨界值肯定還存在, 如果是首次初始化,它的臨界值則為0 else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; //數(shù)組未初始化的情況,將閾值和擴(kuò)容因子都設(shè)置為默認(rèn)值 else { // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } //初始化容量小于16的時(shí)候,擴(kuò)容閾值是沒(méi)有賦值的 if (newThr == 0) { //創(chuàng)建閾值 float ft = (float)newCap * loadFactor; //判斷新容量和新閾值是否大于最大容量 newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } //計(jì)算出來(lái)的閾值賦值 threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) //根據(jù)上邊計(jì)算得出的容量 創(chuàng)建新的數(shù)組 Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; //賦值 table = newTab; //擴(kuò)容操作,判斷不為空證明不是初始化數(shù)組 if (oldTab != null) { //遍歷數(shù)組 for (int j = 0; j < oldCap; ++j) { Node<K,V> e; //判斷當(dāng)前下標(biāo)為j的數(shù)組如果不為空的話賦值個(gè)e,進(jìn)行下一步操作 if ((e = oldTab[j]) != null) { //將數(shù)組位置置空 oldTab[j] = null; //判斷是否有下個(gè)節(jié)點(diǎn) if (e.next == null) //如果沒(méi)有,就重新計(jì)算在新數(shù)組中的下標(biāo)并放進(jìn)去 newTab[e.hash & (newCap - 1)] = e; //有下個(gè)節(jié)點(diǎn)的情況,并且判斷是否已經(jīng)樹(shù)化 else if (e instanceof TreeNode) //進(jìn)行紅黑樹(shù)的操作 ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); //有下個(gè)節(jié)點(diǎn)的情況,并且沒(méi)有樹(shù)化(鏈表形式) else { //比如老數(shù)組容量是16,那下標(biāo)就為0-15 //擴(kuò)容操作*2,容量就變?yōu)?2,下標(biāo)為0-31 //低位:0-15,高位16-31 //定義了四個(gè)變量 // 低位頭 低位尾 Node<K,V> loHead = null, loTail = null; // 高位頭 高位尾 Node<K,V> hiHead = null, hiTail = null; //下個(gè)節(jié)點(diǎn) Node<K,V> next; //循環(huán)遍歷 do { //取出next節(jié)點(diǎn) next = e.next; //通過(guò) 與操作 計(jì)算得出結(jié)果為0 if ((e.hash & oldCap) == 0) { //如果低位尾為null,證明當(dāng)前數(shù)組位置為空,沒(méi)有任何數(shù)據(jù) if (loTail == null) //將e值放入低位頭 loHead = e; //低位尾不為null,證明已經(jīng)有數(shù)據(jù)了 else //將數(shù)據(jù)放入next節(jié)點(diǎn) loTail.next = e; //記錄低位尾數(shù)據(jù) loTail = e; } //通過(guò) 與操作 計(jì)算得出結(jié)果不為0 else { //如果高位尾為null,證明當(dāng)前數(shù)組位置為空,沒(méi)有任何數(shù)據(jù) if (hiTail == null) //將e值放入高位頭 hiHead = e; //高位尾不為null,證明已經(jīng)有數(shù)據(jù)了 else //將數(shù)據(jù)放入next節(jié)點(diǎn) hiTail.next = e; //記錄高位尾數(shù)據(jù) hiTail = e; } //如果e不為空,證明沒(méi)有到鏈表尾部,繼續(xù)執(zhí)行循環(huán) } while ((e = next) != null); //低位尾如果記錄的有數(shù)據(jù),是鏈表 if (loTail != null) { //將下一個(gè)元素置空 loTail.next = null; //將低位頭放入新數(shù)組的原下標(biāo)位置 newTab[j] = loHead; } //高位尾如果記錄的有數(shù)據(jù),是鏈表 if (hiTail != null) { //將下一個(gè)元素置空 hiTail.next = null; //將高位頭放入新數(shù)組的(原下標(biāo)+原數(shù)組容量)位置 newTab[j + oldCap] = hiHead; } } } } } //返回新的數(shù)組對(duì)象 return newTab; } ```
map.get(k)實(shí)現(xiàn)原理
(1)、先調(diào)用k的hashCode()方法得出哈希值,并通過(guò)哈希算法轉(zhuǎn)換成數(shù)組的下標(biāo)。
(2)、在通過(guò)數(shù)組下標(biāo)快速定位到某個(gè)位置上。重點(diǎn)理解如果這個(gè)位置上什么都沒(méi)有,則返回null。如果這個(gè)位置上有單向鏈表,那么它就會(huì)拿著參數(shù)K和單向鏈表上的每一個(gè)節(jié)點(diǎn)的K進(jìn)行equals,如果所有equals方法都返回false,則get方法返回null。如果其中一個(gè)節(jié)點(diǎn)的K和參數(shù)K進(jìn)行equals返回true,那么此時(shí)該節(jié)點(diǎn)的value就是我們要找的value了,get方法最終返回這個(gè)要找的value。
HashMap中的get()方法
public V get(Object key) { Node<K,V> e; return (e = getNode(hash(key), key)) == null ? null : e.value; } ```
getNode()方法
final Node<K,V> getNode(int hash, Object key) { Node<K,V>[] tab; Node<K,V> first, e; int n; K k; //判斷數(shù)組不為null并且長(zhǎng)度大于0,并且通過(guò)hash算出來(lái)的數(shù)組下標(biāo)的位置不為空,證明有數(shù)據(jù) if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) { //判斷數(shù)組的位置的key的hash和內(nèi)容是否等同與要查詢的數(shù)據(jù) if (first.hash == hash && // always check first node ((k = first.key) == key || (key != null && key.equals(k)))) //相等的話直接返回 return first; //判斷是否有下個(gè)節(jié)點(diǎn) if ((e = first.next) != null) { //判斷是否為為紅黑樹(shù) if (first instanceof TreeNode) //進(jìn)行紅黑樹(shù)查詢操作 return ((TreeNode<K,V>)first).getTreeNode(hash, key); //鏈表查詢操作 do { //循環(huán)鏈表,逐一判斷 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) //發(fā)現(xiàn)key的話就返回 return e; } while ((e = e.next) != null); } } //沒(méi)有查詢到返回null return null; }
四、HashMap常見(jiàn)面試題分析
為何HashMap的數(shù)組長(zhǎng)度一定是2的次冪?
首先,HashMap的初始化的數(shù)組長(zhǎng)度一定是2的n次的,每次擴(kuò)容仍是原來(lái)的2倍的話,就不會(huì)破壞這個(gè)規(guī)律,每次擴(kuò)容后,原數(shù)據(jù)都會(huì)進(jìn)行數(shù)據(jù)遷移,根據(jù)二進(jìn)制的計(jì)算,擴(kuò)容后數(shù)據(jù)要么在原來(lái)位置,要么在【原來(lái)位置+擴(kuò)容長(zhǎng)度】,這樣就不需要重新hash,效率上更高。
HashMap中,如果想存入數(shù)據(jù),首先它需要根據(jù)key的哈希值去定位落入哪個(gè)桶中
HashMap的做法,我總結(jié)的是,三步:>>>無(wú)符號(hào)右移、^異或、&與
具體是:拿著key的哈希值,先“>>>”無(wú)符號(hào)右移16位,然后“^”異或上key的哈希值,得到一個(gè)值,再拿著這個(gè)值去“&”上數(shù)組長(zhǎng)度減一
最后得出一個(gè)數(shù)(如果數(shù)組長(zhǎng)度是15的話,那這個(gè)數(shù)就是一個(gè)0-15之間的一個(gè)數(shù)),這個(gè)數(shù)就是得出的數(shù)組腳標(biāo)位置,也就是存入的桶的位置。
由上邊可以知道,定位桶的位置最后需要做一個(gè) “&” 與運(yùn)算,&完了得出一個(gè)數(shù),就是桶的位置
知道了這些以后,再來(lái)說(shuō)為什么HashMap的長(zhǎng)度之所以一定是2的次冪?
至少有以下**兩個(gè)原因**:
1、HashMap的長(zhǎng)度是2的次冪的話,可以讓**數(shù)據(jù)更散列更均勻的分布**,更充分的利用數(shù)組的空間
怎么理解呢?下面舉例子說(shuō)一下如果不是2的次冪的數(shù)的話假設(shè)數(shù)組長(zhǎng)度是一個(gè)奇數(shù),那參與最后的&運(yùn)算的肯定就是偶數(shù),那偶數(shù)的話,它二進(jìn)制的最后一個(gè)低位肯定是0,0做完&運(yùn)算得到的肯定也是0,那意味著&完后得到的數(shù)的最低位一定是0最低位一定是0的話,那說(shuō)明一定是一個(gè)偶數(shù),換句話說(shuō)就是:&完得到的數(shù)一定是一個(gè)偶數(shù),所以&完獲取到的腳標(biāo)永遠(yuǎn)是偶數(shù)位,那意味著奇數(shù)位的腳標(biāo)永遠(yuǎn)都沒(méi)值,**有一半的空間是浪費(fèi)的**奇數(shù)說(shuō)完了,來(lái)說(shuō)一下偶數(shù),假設(shè)數(shù)組長(zhǎng)度是一個(gè)偶數(shù),比如6,那參與&運(yùn)算的就是55的二進(jìn)制 00000000 00000000 00000000 00000101發(fā)現(xiàn)任何一個(gè)數(shù)&上5,倒數(shù)第二低位永遠(yuǎn)是0,那就意味著&完以后,最起碼肯定得不出2或者3(這點(diǎn)剛開(kāi)始不好理解,但是好好想一下就能明白)意味著第二和第三腳標(biāo)位肯定不會(huì)有值。
雖然偶數(shù)的話,不會(huì)像奇數(shù)那么夸張會(huì)有一半的腳標(biāo)位得不到,但是也總會(huì)有一些腳標(biāo)位得不到的。**所以不是2的次冪的話,不管是奇數(shù)還是偶數(shù),就肯定注定了某些腳標(biāo)位永遠(yuǎn)是沒(méi)有值的,而某些腳標(biāo)位永遠(yuǎn)是沒(méi)有值的,就意味著浪費(fèi)空間,會(huì)讓數(shù)據(jù)散列的不充分,這對(duì)HashMap來(lái)說(shuō)絕對(duì)是個(gè)災(zāi)難!**
2、HashMap的長(zhǎng)度一定是2的次冪,還有另外一個(gè)原因,那就是在擴(kuò)容遷移的時(shí)候不需要再重新通過(guò)哈希定位新的位置了。擴(kuò)容后,元素新的位置,要么在原腳標(biāo)位,要么在原腳標(biāo)位+擴(kuò)容長(zhǎng)度這么一個(gè)位置。
比如擴(kuò)容前長(zhǎng)度是8,擴(kuò)容后長(zhǎng)度是16 第一種情況: 擴(kuò)容前: 00000000 00000000 00000000 00000101 &00000000 00000000 00000000 00000111 8-1=7 ------------------------------------- 101 ===== 5 原來(lái)腳標(biāo)位是5 擴(kuò)容后: 00000000 00000000 00000000 00000101 &00000000 00000000 00000000 00001111 16-1=15 ------------------------------------- 101 ===== 5 擴(kuò)容后腳標(biāo)位是5(原腳標(biāo)位) 第二種情況: 擴(kuò)容前: 00000000 00000000 00000000 00001101 &00000000 00000000 00000000 00000111 8-1=7 ------------------------------------- 101 ===== 5 原來(lái)腳標(biāo)位是5 擴(kuò)容后: 00000000 00000000 00000000 00001101 &00000000 00000000 00000000 00001111 16-1=15 ------------------------------------- 1101 ===== 13 擴(kuò)容后腳標(biāo)位是13(原腳標(biāo)位+擴(kuò)容長(zhǎng)度) ```
擴(kuò)容后到底是在原來(lái)位置還是在原腳標(biāo)位+擴(kuò)容長(zhǎng)度的位置,主要是看新擴(kuò)容最左邊一個(gè)1對(duì)應(yīng)的上方數(shù)字是0還是1如果是0則擴(kuò)容后在原來(lái)位置,如果是1則擴(kuò)容后在原腳標(biāo)位+擴(kuò)容長(zhǎng)度的位置HashMap源碼里擴(kuò)容也是這么做的。
總結(jié)來(lái)說(shuō),就是hash&(n-1)這個(gè)計(jì)算有關(guān)。如果不為n不為2的n次方的話,那轉(zhuǎn)換為二進(jìn)制情況下,n-1就會(huì)有某一位為0,那與hash做了&運(yùn)算后,該位置永遠(yuǎn)為0,那么計(jì)算出來(lái)的數(shù)組位置就永遠(yuǎn)會(huì)有某個(gè)下標(biāo)的數(shù)組位置是空的,也就是這個(gè)位置永遠(yuǎn)不會(huì)有值。
JDK1.8中HashMap的性能優(yōu)化
JDK1.8在1.7的基礎(chǔ)上對(duì)一些操作進(jìn)行了優(yōu)化。
| 不同 | JDK1.7 | JDK1.8 |
| ------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| 存儲(chǔ)結(jié)構(gòu) | 數(shù)組+鏈表 | 數(shù)組+鏈表+紅黑樹(shù) |
| 初始化方式 | 單獨(dú)函數(shù)inflateTable() | 集成至擴(kuò)容方法resize() |
| hash值計(jì)算方式 | 擾動(dòng)處理=9次擾動(dòng)=4次位運(yùn)算+5次異或運(yùn)算 | 擾動(dòng)處理=2次擾動(dòng)=1次位運(yùn)算+1次異或運(yùn)算 |
| 存放數(shù)據(jù)規(guī)則 | 無(wú)沖突時(shí),存放數(shù)組;沖突時(shí)存放鏈表 | 無(wú)沖突時(shí),存放數(shù)組;沖突&鏈表長(zhǎng)度<8:c存放單鏈表;沖突&鏈表長(zhǎng)度 >8:樹(shù)化并存放紅黑樹(shù) |
| 插入數(shù)據(jù)方式 | 頭插法(將原位置的數(shù)據(jù)移動(dòng)到后一位,再插入數(shù)據(jù)到該位置) | 尾插法 (直接插入鏈表尾部/紅黑樹(shù)) |
| 擴(kuò)容后存儲(chǔ)位置的計(jì)算方式 | 全部按照原來(lái)的方法進(jìn)行運(yùn)算(hashCode()->>擾動(dòng)函數(shù)->>(h&length-1)) | 按照擴(kuò)容后的規(guī)則計(jì)算(即擴(kuò)容后位置=原位置或原位置+舊容量) |
注意:JDK1.8里轉(zhuǎn)換為紅黑樹(shù)的時(shí)候,數(shù)組長(zhǎng)度必須大于64,如果數(shù)組長(zhǎng)度小于64,鏈表長(zhǎng)度達(dá)到8的話,會(huì)進(jìn)行resize擴(kuò)容操作。
五、總結(jié)
看到這里,我們已經(jīng)HashMap的源碼和實(shí)現(xiàn)有了清晰的理解,并且對(duì)它的構(gòu)造方法再到它的一個(gè)put數(shù)據(jù)和get數(shù)據(jù)的一個(gè)源碼解析,還有一些它里邊比較精妙和重要的一些方法也都探索清楚了,希望這些知識(shí)點(diǎn)可以在大家以后的面試中也能夠幫助到大家,斬獲一個(gè)心儀的offer。