版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Hadoop.ZooKeeper及HBase的安裝配■過(guò)程(絕對(duì)可用)這兩天正在為公司配置一個(gè)Hadoop集群(以及HBase),作為存儲(chǔ)及計(jì)算海量數(shù)據(jù)的平臺(tái)。現(xiàn)在將安裝的過(guò)程貼出來(lái),僅供參考。Hadoop的配置?集群的物理配置情況集群IP:13~18(hostname分別為master、slave。、slave1、slave2、slave3、slave4)用戶(hù)名/密碼:root/123456其中,master作為jobtracker和namenode,其余節(jié)點(diǎn)作為tasktracker和datanode?節(jié)點(diǎn)角色分配修改每個(gè)節(jié)點(diǎn)的/etc/hosts文件,追加如下內(nèi)容masterslaveOslave1slave2slave3slave4再修改每個(gè)節(jié)點(diǎn)自己的hostname,如對(duì)于master,將其/etc/sysconfig/network文件改為NETWORKING=yesHOSTNAME=master然后,運(yùn)行hostnamemaster退出,再進(jìn)入輸入env|grephostname發(fā)現(xiàn)修改生效?為每個(gè)節(jié)點(diǎn)設(shè)置無(wú)密碼ssh登錄1、 在master節(jié)點(diǎn)上運(yùn)行ssh-keygen-trsa2、 在master節(jié)點(diǎn)上,首先cat/.ssh/id_rsa.pub>>/.ssh/authorized_keys然后chmod644/.ssh/authorized_keys3、 將master節(jié)點(diǎn)上的/.ssh/id_rsa.pub文件分別scp到每個(gè)slave節(jié)點(diǎn)上,如scp/.ssh/id_rsa.pubroot@slave0:/home4、 登錄每個(gè)slave節(jié)點(diǎn),運(yùn)行(以slave0為例)cat/home/id_rsa.pub>>/.ssh/authorized_keys5、 修改文件權(quán)限chmod600/.ssh/authorized_keys6、 從第3步開(kāi)始循環(huán),直至配置好每個(gè)slave節(jié)點(diǎn)?下載Hadoop下載hadoop-1.1.2,放在/home/LTE目錄下,用命令tarzxvfhadoop-1.1.2.tar.gz解壓,在/home/LTE下生成目錄hadoopT.1.2?修改HADOOP的配置文件修改conf/core-site.xml文件〈configuration〉〈property〉<name></name><value>hdfs://master:54310</value></property><property><name>hadoop.tmp.dir</name><value>/home/LTE/hadoop/tmp</value></property>〈/configuration)在conf/hadoop-env.xml文件里增加exportJAVA_HOME=/usr/local/java/jdk1.6.0_32修改conf/hdfs-site.xml文件:〈configuration)〈property〉<name>dfs.replication</name><value>2</value>〈/property〉〈property〉<name>dfs.data.dir</name><value>/home/LTE/hadoop/data</value>〈/property〉〈property〉<name>.dir</name>〈value>/home/LTE/hadoop/name〈/value></property>〈/configuration〉修改conf/mapred-site.xml文件:〈configuration〉<property>〈name>mapred.job.tracker〈/name>〈value>master:9001〈/value></property><property>〈name>mapred.local.dir〈/name>〈value>/home/LTE/hadoop/temp〈/value></property>〈/configuration〉conf/masters文件masterconf/slaves文件slaveOslavelslave2slave3slave4從master節(jié)點(diǎn)上,將/home/LTE目錄依次拷貝到每個(gè)slave節(jié)點(diǎn)的/home目錄下啟動(dòng)Hadoop在master節(jié)點(diǎn)的/home/LTE/hadoop-1.1.2目錄下進(jìn)行HDFS的格式化bin/hadoopnamenode-format格式化后,HDFS中的內(nèi)容會(huì)全部丟失然后,開(kāi)啟Hadoop集群bin/start-all.sh此時(shí),Hadoop集群已經(jīng)啟動(dòng),可以提交運(yùn)算的作業(yè)了。HBase的配置安裝HBase時(shí),不僅需要HBase本身,還需要ZooKeeper來(lái)提供、管理和協(xié)調(diào)分布式服務(wù)。在運(yùn)行HBase之前,也需要先啟動(dòng)ZooKeeper服務(wù)。另外,有些版本的HBase只能支持特定版本的Hadoop,如下表:HBase-O.92.xHadoop-0.20.205SHadaop-0.22.xSHadoop-1.0.0-1.0.2[^]SHadoop-l.0.3+sHadoop-1.1.xNTHadaop-0.23.xXHadoop-2.xX[旦]HBaserequireshadoop1.0,3ataminimum;thereisanissuewheagainstearlierversionsofHadoop?在本文中,采用了Hadoop-1.1.2,HBase-0.94.8,以及ZooKeeper-3.4.5由于ZooKeeper采用了Paxos算法來(lái)進(jìn)行選舉,因此實(shí)際能夠有效參與選舉的節(jié)點(diǎn)數(shù)量是奇數(shù)。所以,我們?cè)诎惭bHBase和ZooKeeper時(shí),只采用奇數(shù)個(gè)節(jié)點(diǎn)(本文采用5個(gè)節(jié)點(diǎn),分別為master、slave。、slavel、slave2、slave3)。安裝ZooKeeper將zookeeper-3.4.5.tar.gz在/home/LTE下解壓,生成zookeeper-3.4.5目錄。在/home/LTE/zookeeper-3.4.5/conf中,有zoo_sample.cfg文件,使用命令cpzoo_sample.cfgzoo.cfg命令生成zoo.cfg配置文件。編輯zoo.cfg的內(nèi)容,如下:[html]viewplaincopyprint?ThenumberofmillisecondsofeachticktickTime=2000ThenumberofticksthattheinitialsynchronizationphasecantakeinitLimit=10ThenumberofticksthatcanpassbetweensendingarequestandgettinganacknowledgementsyncLimit=5thedirectorywherethesnapshotisstored.donotuse/tmpforstorage,/tmphereisjustexamplesakes.dataDir=/home/LTE/zookeepertheportatwhichtheclientswillconnectclientPort=2181server.1=master:2888:3888server.2=slave0:2888:3888server.3=slave1:2888:3888server.4=slave2:2888:3888server.5=slave3:2888:3888Besuretoreadthemaintenancesectionoftheadministratorguidebeforeturningonautopurge.#/doc/current/zookeeperAdmin.html#sc_maintenance#ThenumberofsnapshotstoretainindataDir#autopurge.snapRetainCount=3PurgetaskintervalinhoursSetto"0"todisableautopurgefeature#autopurge.purgeInterval=1為了讓系統(tǒng)能夠識(shí)別zoo.cfg中的server.id=host:port:port中的server.id,在master節(jié)點(diǎn)的/home/LTE/zookeeper中創(chuàng)建一個(gè)文件myid,里面只有一個(gè)數(shù)字1同理,在slaveO節(jié)點(diǎn)的/home/LTE/zookeeper中創(chuàng)建一個(gè)文件myid,里面只有一個(gè)數(shù)字2;以此類(lèi)推….直至slave3節(jié)點(diǎn)。注意,這里id的范圍是1~255。以上配置(zookeeper以及zookeeper-3.4.5)要復(fù)制到集群中的每一個(gè)節(jié)點(diǎn)上去。在/etc/profile的最后添加:[html]viewplaincopyprint?exportHBASE_HOME=/home/LTE/hbase-0.94.8exportHAD00P_H0ME=/home/LTE/hadoop-1.1.2exportZK_HOME=/home/LTE/zookeeper-3.4.5exportJAVA_HOME=/usr/local/java/jdk1.6.0_32exportCLASSPATH=$CLASSPATH:$HBASE_HOME/lib:$JAVA_HOME/libexportPATH=$JAVA_HOME/bin:$HBASE_HOME/bin:$ANT_HOME/bin:$HADOOP_HOME/bin:$ZK_HOME/bin:$PATH然后,source/etc/profile這個(gè)操作要在集群的每一個(gè)節(jié)點(diǎn)上進(jìn)行啟動(dòng)ZooKeeper在每一個(gè)節(jié)點(diǎn)的/home/LTE/zookeeper-3.4.5/bin中執(zhí)行命令:./zkServer.shstart這樣就啟動(dòng)了zookeeper集群中的各個(gè)節(jié)點(diǎn)。輸入命令./zkServer.shstatus可以查看當(dāng)前節(jié)點(diǎn)在zookeeper集群中的角色是leader還是follower安裝HBase將/home/LTE/hbase-0.94.8.tar.gz解壓,生成/home/LTE/hbase-0.94.8。在hbase-0.94.8/lib中,原來(lái)有一個(gè)hadoop-core-1.0.4.jar文件,但是我們用的Hadoop的版本是hadoop-1.1.2,所以需要將hbase-0.94.8/lib/hadoop-core-1.0.4.jar替換成hadoop-1.1.2/hadoop-core-1.1.2.jar,否則會(huì)有沖突。打開(kāi)conf/hbase-env.sh文件,將其中最后一行改為:exportHBASE_MANAGES_ZK=false這表示我們不使用hbase-0.94.8自帶的zookeeper,而是使用我們剛才自己安裝的zookeeper-2.3.4(具體指定使用哪個(gè)zookeeper是通過(guò)/etc/profile中的ZK_HOME變量來(lái)指定的)。下面,打開(kāi)conf/hbase-site.xml文件,添加以下內(nèi)容:[html]viewplaincopyprint?1.〈configuration〉2.〈property〉3.<name>hbase.rootdir</name>4.<value>hdfs://master:54310/hbase</value>5.〈/property〉6.〈property〉7.<name>hbase.cluster.distributed</name〉8.〈value〉true</value〉9.</property>10.〈property〉11.〈name〉dfs.replication〈/name〉12.〈value〉3〈/value〉13.</property>14.<property>15.〈name〉hbase.zookeeper.quorum〈/name〉16.〈value〉master,slave0,slave1,slave2,slave3〈/value〉17.</property>18.<property>19.〈name〉perty.dataDir〈/name>20.〈value〉/home/LTE/zookeeper/dataDir〈/value〉21.</property>22.“configuration〉其中,我們需要通過(guò)hbase.rootdir指定HDFS的一個(gè)namenode節(jié)點(diǎn),并讓HBase將數(shù)據(jù)寫(xiě)入HDFS中的一個(gè)目錄(本例中就是hdfs://master:54310/hbase);hbase.zookeeper.quorum指定了哪些節(jié)點(diǎn)運(yùn)行QuorumPeer(即QuorumPeerMain進(jìn)程),個(gè)數(shù)需為奇數(shù)。下面,打開(kāi)文件conf/regionservers,添加以下內(nèi)容:[html]viewplaincopyprint?slaveOslavelslave2slave3該文件指定了HRegionServer進(jìn)程將在哪些節(jié)點(diǎn)上運(yùn)行。以上配置需要在HBase的每一個(gè)節(jié)點(diǎn)中生效。啟動(dòng)HBaseOK,現(xiàn)在HBase集群配置好了。我們來(lái)啟動(dòng)HBase。進(jìn)入$HBASE_HOME/bin目錄下,輸入命令./start-hbase.sh在HBase集群?jiǎn)?dòng)之后,鍵入命令./hbaseshell啟動(dòng)HBase的控制臺(tái)界面我們可以在瀏覽器中查看HBase系統(tǒng)的運(yùn)行狀態(tài),地址為13:60010/master-status,其中13是master所在節(jié)點(diǎn)的IP.常見(jiàn)問(wèn)題1、HBase中的某個(gè)節(jié)點(diǎn)無(wú)法啟動(dòng)這很可能是因?yàn)榧褐懈鱾€(gè)節(jié)點(diǎn)的系統(tǒng)時(shí)間不一致(時(shí)間差超出了某個(gè)閾值),這是我們需要將幾臺(tái)機(jī)器間的時(shí)間調(diào)整一致。我們可以將master作為時(shí)間服務(wù)器,讓其他機(jī)器與master進(jìn)行對(duì)時(shí)。首先,在master上鍵入命令servicentpdstart來(lái)開(kāi)啟master上的時(shí)間服務(wù)器。等待幾分鐘后,在其他每一臺(tái)機(jī)器上鍵入命令ntpdatemaster來(lái)與master進(jìn)行對(duì)時(shí)2、由于缺少一些jar包引起的異常在HBase上運(yùn)行一些Hadoop的MR程序時(shí),可能會(huì)報(bào)以下異常:[plain]viewplaincopyprint?1.Exceptioninthread"main"java.lang.NoClassDefFoundError:com/google/protobuf/MessageCausedby:java.lang.ClassNotFoundException:tobuf.Message或者[plain]viewplaincopyprint?1.Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/zookeeper/KeeperException3.Causedby:java.lang.ClassNotFoundException:org.apache.zookeeper.KeeperException解決方法:①在Hadoop的conf/hadoop-env.sh中設(shè)置HADOOP_CLASSPATH變量exportHADOOP_CLASSPATH=/home/LTE/hbase-0.94.8/lib:/home/LTE/zookeeper-3.4.5/lib:/home/LTE/hbase-0.94.8/hbase-0.94.8.jar:/home/LTE/zookeeper-3.4.5/zookeeper-3.4.5.jar②將/home/LTE/hbase-0.9
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年天津醫(yī)科大學(xué)臨床醫(yī)學(xué)院馬克思主義基本原理概論期末考試模擬題附答案解析(必刷)
- 2026廣東佛山順德區(qū)教育科學(xué)研究院附屬容桂中學(xué)后勤人員招聘?jìng)淇碱}庫(kù)及1套參考答案詳解
- 2025年四川長(zhǎng)江職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試題庫(kù)帶答案解析
- 2025年海南洛桑旅游大學(xué)馬克思主義基本原理概論期末考試模擬題含答案解析(必刷)
- 2025年上海紐約大學(xué)馬克思主義基本原理概論期末考試模擬題含答案解析(必刷)
- 2024年靖邊縣幼兒園教師招教考試備考題庫(kù)帶答案解析(必刷)
- 2025年北京農(nóng)業(yè)職業(yè)學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析(必刷)
- 2024年渤海大學(xué)馬克思主義基本原理概論期末考試題帶答案解析(奪冠)
- 2025年濟(jì)寧職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)附答案解析
- 2025年吉林科技職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性考試題庫(kù)帶答案解析
- 婦科醫(yī)師年終總結(jié)和新年計(jì)劃
- 2026海南安保控股有限責(zé)任公司招聘11人筆試模擬試題及答案解析
- 裝飾裝修工程施工組織設(shè)計(jì)方案(二)
- 2026上海碧海金沙投資發(fā)展有限公司社會(huì)招聘參考題庫(kù)必考題
- 靜脈用藥調(diào)配中心(PIVAS)年度工作述職報(bào)告
- 保險(xiǎn)業(yè)客戶(hù)服務(wù)手冊(cè)(標(biāo)準(zhǔn)版)
- 檢驗(yàn)科內(nèi)控制度
- DB44-T 2771-2025 全域土地綜合整治技術(shù)導(dǎo)則
- nccn臨床實(shí)踐指南:宮頸癌(2025.v2)課件
- 淺談醫(yī)藥價(jià)格管理現(xiàn)狀透析
- 全屋定制合同協(xié)議模板2025年標(biāo)準(zhǔn)版
評(píng)論
0/150
提交評(píng)論