首頁技術(shù)文章正文

大數(shù)據(jù)離線階段Day9之HDFS安全模式

更新時間:2018-10-24 來源:黑馬程序員 瀏覽量:

  1. 安全模式概述

  安全模式是HDFS所處的一種特殊狀態(tài),在這種狀態(tài)下,文件系統(tǒng)只接受讀數(shù)據(jù)請求,而不接受刪除、修改等變更請求,是一種保護機制,用于保證集群中的數(shù)據(jù)塊的安全性。

  在NameNode主節(jié)點啟動時,HDFS首先進入安全模式,集群會開始檢查數(shù)據(jù)塊的完整性。DataNode在啟動的時候會向namenode匯報可用的block信息,當(dāng)整個系統(tǒng)達到安全標(biāo)準(zhǔn)時,HDFS自動離開安全模式。

  假設(shè)我們設(shè)置的副本數(shù)(即參數(shù)dfs.replication)是5,那么在Datanode上就應(yīng)該有5個副本存在,假設(shè)只存在3個副本,那么比例就是3/5=0.6。在配置文件hdfs-default.xml中定義了一個最小的副本的副本率(即參數(shù)dfs.namenode.safemode.threshold-pct)0.999。

  我們的副本率0.6明顯小于0.99,因此系統(tǒng)會自動的復(fù)制副本到其他的DataNode,使得副本率不小于0.999.如果系統(tǒng)中有8個副本,超過我們設(shè)定的5個副本,那么系統(tǒng)也會刪除多余的3個副本。

  如果HDFS處于安全模式下,不允許HDFS客戶端進行任何修改文件的操作,包括上傳文件,刪除文件,重命名,創(chuàng)建文件夾,修改副本數(shù)等操作。

  2. 安全模式配置

  與安全模式相關(guān)主要配置在hdfs-site.xml文件中,主要有下面幾個屬性:

  dfs.namenode.replication.min: 每個數(shù)據(jù)塊最小副本數(shù)量,默認為1. 在上傳文件時,達到最小副本數(shù),就認為上傳是成功的。

  dfs.namenode.safemode.threshold-pct: 達到最小副本數(shù)的數(shù)據(jù)塊的百分比。默認為0.999f。當(dāng)小于這個比例,那就將系統(tǒng)切換成安全模式,對數(shù)據(jù)塊進行復(fù)制;當(dāng)大于該比例時,就離開安全模式,說明系統(tǒng)有足夠的數(shù)據(jù)塊副本數(shù),可以對外提供服務(wù)。小于等于0意味不進入安全模式,大于1意味一直處于安全模式。

  dfs.namenode.safemode.min.datanodes: 離開安全模式的最小可用datanode數(shù)量要求,默認為0.也就是即使所有datanode都不可用,仍然可以離開安全模式。

  dfs.namenode.safemode.extension: 當(dāng)集群可用block比例,可用datanode都達到要求之后,如果在extension配置的時間段之后依然能滿足要求,此時集群才離開安全模式。單位為毫秒,默認為30000.也就是當(dāng)滿足條件并且能夠維持30秒之后,離開安全模式。 這個配置主要是對集群穩(wěn)定程度做進一步的確認。避免達到要求后馬上又不符合安全標(biāo)準(zhǔn)。

  總結(jié)一下,要離開安全模式,需要滿足以下條件:

  1)達到副本數(shù)量要求的block比例滿足要求;

  2)可用的datanode節(jié)點數(shù)滿足配置的數(shù)量要求;

  3) 1、2 兩個條件滿足后維持的時間達到配置的要求

  3. 安全模式命令

  手動進入安全模式

  hdfs dfsadmin -safemode enter

  手動進入安全模式對于集群維護或者升級的時候非常有用,因為這時候HDFS上的數(shù)據(jù)是只讀的。手動退出安全模式可以用下面命令:

  hdfs dfsadmin -safemode leave

  如果你想獲取到集群是否處于安全模式,可以用下面的命令獲?。?

  hdfs dfsadmin -safemode get(也可在web頁面查看安全模式狀態(tài))



作者 :黑馬程序員大數(shù)據(jù)培訓(xùn)學(xué)院
首發(fā):http://cloud.itheima.com

分享到:
在線咨詢 我要報名
和我們在線交談!