更新時(shí)間:2021-07-26 來(lái)源:黑馬程序員 瀏覽量:
掌握了Hadoop集群中的高可用架構(gòu)后,接下來(lái),我們來(lái)手把手教大家搭建一個(gè)Hadoop高可用集群,具體步驟如下:
1.部署集群節(jié)點(diǎn)
我們規(guī)劃整個(gè)集群由3臺(tái)虛擬機(jī)組成,這3臺(tái)虛擬機(jī)在高可用集群中的部署規(guī)劃情況如表1所示。
表1 集群節(jié)點(diǎn)分布
服務(wù)器 | Name Node | Data Node | Resource Manager | Node Manager | Journal Nodes | Zookeeper | ZKFC |
---|---|---|---|---|---|---|---|
node-01 | √ | √ | √ | √ | √ | √ | √ |
node-02 | √ | √ | √ | √ | √ | √ | |
node-03 | √ | √ | √ | √ |
表1所示的三個(gè)服務(wù)器組成了一個(gè)Zookeeper集群。其中,node-01和node-02作為集群的NameNode,需要運(yùn)行ZKFC來(lái)監(jiān)控NameNode的健康狀態(tài)。
2.環(huán)境準(zhǔn)備
首先,搭建普通Hadoop集群。需要注意的是,原有虛擬機(jī)系統(tǒng)主機(jī)名為hadoop01,建議初學(xué)者在搭建Hadoop HA集群時(shí)重新安裝虛擬機(jī),以此來(lái)鞏固前面所學(xué)知識(shí),并將三臺(tái)虛擬主機(jī)名設(shè)置為node-01、node-02和node-03。
3.配置Hadoop高可用集群
(1)修改core-site.xml文件,在該文件中配置HDFS端口,指定Hadoop臨時(shí)目錄和Zookeeper集群地址,具體參數(shù)如下:
<configuration> <!-- 指定hdfs的nameservice為ns1 --> <property> <name>fs.defaultFS</name> <value>hdfs://ns1</value> </property> <!-- 指定hadoop臨時(shí)目錄 --> <property> <name>hadoop.tmp.dir</name> <value>/export/servers/hadoop-2.7.4/tmp</value> </property> <!-- 指定zookeeper地址 --> <property> <name>ha.zookeeper.quorum</name> <value>node-01:2181,node-02:2181,node-03:2181</value> </property></configuration>
(2)修改hdfs-site.xml文件,配置兩臺(tái)NameNode端口地址和通信方式,并指定NameNode的元數(shù)據(jù)上的存放位置,開(kāi)啟NameNode失敗自動(dòng)切換以及配置sshfence(通過(guò)ssh遠(yuǎn)程登錄到前一個(gè)Active NameNode并將其結(jié)束進(jìn)程),具體參數(shù)如下:
<configuration> <!-- 設(shè)置副本個(gè)數(shù) --> <property> <name>dfs.replication</name> <value>2</value> </property> <!-- 設(shè)置namenode.name目錄 --> <property> <name>dfs.namenode.name.dir</name> <value>file:/export/data/hadoop/name</value> </property> <!-- 設(shè)置namenode.data目錄 --> <property> <name>dfs.datanode.data.dir</name> <value>file:/export/data/hadoop/data</value> </property> <!-- 開(kāi)啟webHDFS --> <property> <name>dfs.webhdfs.enabled</name> <value>true</value> <!-- 在NN和DN上開(kāi)啟WebHDFS (REST API)功能,不是必須 --> </property> <!--指定hdfs的nameservice為ns1,需要和core-site.xml中的保持一致 --> <property> <name>dfs.nameservices</name> <value>ns1</value> </property> <!-- ns1下面有兩個(gè)NameNode,分別是nn1,nn2 --> <property> <name>dfs.ha.namenodes.ns1</name> <value>nn1,nn2</value> </property> <!-- nn1的RPC通信地址 --> <property> <name>dfs.namenode.rpc-address.ns1.nn1</name> <value>node-01:9000</value> </property> <!-- nn1的http通信地址 --> <property> <name>dfs.namenode.http-address.ns1.nn1</name> <value>node-01:50070</value> </property> <!-- nn2的RPC通信地址 --> <property> <name>dfs.namenode.rpc-address.ns1.nn2</name> <value>node-02:9000</value> </property> <!-- nn2的http通信地址 --> <property> <name>dfs.namenode.http-address.ns1.nn2</name> <value>node-02:50070</value> </property> <!-- 指定NameNode的元數(shù)據(jù)在JournalNode上的存放位置 --> <property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://node-01:8485;node-02:8485;node-03:8485/ns1 </value> </property> <!-- 指定JournalNode在本地磁盤(pán)存放數(shù)據(jù)的位置 --> <property> <name>dfs.journalnode.edits.dir</name> <value>/export/data/hadoop/journaldata</value> </property> <!-- 開(kāi)啟NameNode失敗自動(dòng)切換 --> <property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property> <!-- 配置失敗自動(dòng)切換實(shí)現(xiàn)方式 --> <property> <name>dfs.client.failover.proxy.provider.ns1</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider </value> </property> <!-- 配置隔離機(jī)制方法,多個(gè)機(jī)制用換行分割,即每個(gè)機(jī)制暫用一行--> <property> <name>dfs.ha.fencing.methods</name> <value> sshfence shell(/bin/true) </value> </property> <!-- 使用sshfence隔離機(jī)制時(shí)需要ssh免登陸 --> <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/root/.ssh/id_rsa</value> </property> <!-- 配置sshfence隔離機(jī)制超時(shí)時(shí)間 --> <property> <name>dfs.ha.fencing.ssh.connect-timeout</name> <value>30000</value> </property></configuration>
(3)修改mapred-site.xml文件,配置MapReduce計(jì)算框架為yarn方式,具體參數(shù)如下:
<configuration> <!-- 指定mapreduce框架為yarn方式 --> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
(4)修改yarn-site.xml文件,開(kāi)啟ResourceManager高可用,指定ResourceManager的端口名稱地址,并配置Zookeeper集群地址,具體參數(shù)如下:
<configuration> <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>2048</value> </property> <property> <name>yarn.scheduler.maximum-allocation-mb</name> <value>2048</value> </property> <property> <name>yarn.nodemanager.resource.cpu-vcores</name> <value>1</value> </property> <!-- 開(kāi)啟RM高可用 --> <property> <name>yarn.resourcemanager.ha.enabled</name> <value>true</value> </property> <!-- 指定RM的cluster id --> <property> <name>yarn.resourcemanager.cluster-id</name> <value>yrc</value> </property> <!-- 指定RM的名字 --> <property> <name>yarn.resourcemanager.ha.rm-ids</name> <value>rm1,rm2</value> </property> <!-- 分別指定RM的地址 --> <property> <name>yarn.resourcemanager.hostname.rm1</name> <value>node-01</value> </property> <property> <name>yarn.resourcemanager.hostname.rm2</name> <value>node-02</value> </property> <!-- 指定zk集群地址 --> <property> <name>yarn.resourcemanager.zk-address</name> <value>node-01:2181,node-02:2181,node-03:2181</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
(5)修改slaves,配置集群主機(jī)名稱,具體代碼如下:
node-01 node-02 node-03
(6)修改hadoop-env.sh,配置JDK環(huán)境變量,具體代碼如下:
export JAVA_HOME=/export/servers/jdk1.8.0_161
將配置好的文件分發(fā)傳送給node-02,node-03機(jī)器中,讀者可以根據(jù)需求自定義配置/etc/profile的環(huán)境變量,分發(fā)后需要重新加載該文件。
4.啟動(dòng)Hadoop高可用集群
(1)啟動(dòng)集群各個(gè)節(jié)點(diǎn)的Zookeeper服務(wù),命令如下:
$ cd /export/servers/zookeeper-3.4.10/bin $ ./zkServer.sh start
(2)啟動(dòng)集群各個(gè)節(jié)點(diǎn)監(jiān)控NameNode的管理日志的JournalNode,命令如下:
$ hadoop-daemon.sh start journalnode
(3)在node-01節(jié)點(diǎn)格式化NameNode,并將格式化后的目錄拷貝到node-02中,具體命令如下:
$ hadoop namenode –format $ scp -r /export/data/hadoop node-02:/export/data/
(4)在node-01節(jié)點(diǎn)上格式化ZKFC,命令如下:
$ hdfs zkfc -formatZK
(5)在node-01節(jié)點(diǎn)上啟動(dòng)HDFS,命令如下:
$ start-dfs.sh
(6)在node-01節(jié)點(diǎn)上啟動(dòng)YARN,命令如下:
$ start-yarn.sh