版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
分布式文件系統(tǒng)HDFS簡介2學(xué)習(xí)任務(wù)了解HDFS的概述了解HDFS的特性了解NameNode的啟動流程了解兩個節(jié)點的相關(guān)配置3知識目標(biāo)能夠了解HDFS的概念能夠了解NameNode的啟動流程能夠了解HDFS各組件的參數(shù)配置01能力目標(biāo)能夠簡單敘述HDFS的架構(gòu)及特性能夠簡單敘述HDFS各組件的參數(shù)配置02學(xué)習(xí)目標(biāo)4目錄01HDFS的概述02HDFS的NameNode的啟動流程03HDFS的存儲機(jī)制和數(shù)據(jù)安全04HDFS各組件的參數(shù)配置5HDFS的概述在HDFS集群中,主要分為兩種節(jié)點,分別為Namenode和Datanode。Namenode為集群老大,掌管文件系統(tǒng)目錄樹,處理客戶端讀且請求;DataNode存儲整個集群所有數(shù)據(jù)塊,處理真正數(shù)據(jù)讀寫;SecondaryNamenode持久化元數(shù)據(jù),主要給namenode分擔(dān)壓力之用。HDFS的架構(gòu)分析6HDFS的概述HDFS中的文件在物理上是分塊存儲(block),塊的大小可以通過配置參數(shù)(dfs.blocksize)來規(guī)定,默認(rèn)大小在hadoop2.x版本中是128M,老版本中是64M。HDFS文件系統(tǒng)會給客戶端提供一個統(tǒng)一的抽象目錄樹,客戶端通過路徑來訪問文件Namenode是HDFS集群主節(jié)點,負(fù)責(zé)維護(hù)整個hdfs文件系統(tǒng)的目錄樹,以及每一個路徑(文件)所對應(yīng)的block塊信息(block的id,及所在的datanode服務(wù)器)。HDFS的特性7HDFS的概述Datanode是HDFS集群從節(jié)點,每一個block都可以在多個datanode上存儲多個副本(副本數(shù)量也可以通過參數(shù)設(shè)置dfs.replication,默認(rèn)是3)。HDFS是設(shè)計成適應(yīng)一次寫入,多次讀出的場景,且不支持文件的修改。HDFS的特性8HDFS的NameNode
的啟動流程ecourndarynamenode會通過httpget去下載namenode節(jié)點的鏡像fsimage與edits_log將fsimage加載內(nèi)存當(dāng)中,當(dāng)用數(shù)據(jù)寫入HDFS時記錄到edits_log并生成新edits_logs同時合并fsimage,生成新的fsimage.ckpt鏡像文件,然后將fsimge.ckpt通過httpput上傳到,namenode節(jié)點.namenode節(jié)點最后更名成為新的fsimage。9HDFS的NameNode
的啟動流程Hadoop在格式化文件系統(tǒng)HDFS時候會默認(rèn)生成一個fsimage文件,啟動時會將fsimage鏡像加載到內(nèi)存,然后replay去編輯edit_log默認(rèn)edit_log為空的,。當(dāng)客戶端節(jié)點去整個HDFS的數(shù)據(jù)節(jié)點datenode傳送數(shù)據(jù)文件時,默認(rèn)在安全模式下數(shù)據(jù)節(jié)點datenode會每隔一斷時間發(fā)送一些存儲信息給namenode處理,edit_log就會經(jīng)行記錄,然后進(jìn)行合并鏡像fsimage使當(dāng)前整個鏡像保持在最新狀態(tài)。10HDFS的存儲機(jī)制和數(shù)據(jù)安全HDFS在客戶端上傳文件到整個hdfs時,會在這個block節(jié)點快的形式存儲,切分成塊每個block節(jié)點塊128M。數(shù)據(jù)在存儲在hdfs上的時候包括了兩個文件,一個是上傳文件的本身,一個是元數(shù)據(jù),包括數(shù)據(jù)塊的長度,塊之間的校驗和,以及存儲的時間等。存儲在HDFS上的文件,存儲機(jī)制及數(shù)據(jù)安全性如何保證,主要由以下幾點決定:11HDFS的存儲機(jī)制和數(shù)據(jù)安全數(shù)據(jù)在存儲本身,其每塊副本存儲在不同的datanode節(jié)點之上,默認(rèn)副本數(shù)為3在datanode節(jié)點上默認(rèn)用按就近原則復(fù)制?,F(xiàn)實環(huán)境當(dāng)datanode節(jié)點出現(xiàn)問題時,根據(jù)datanode可以橫向擴(kuò)展新加上的datanode就可以從臨近節(jié)點的副本數(shù),進(jìn)行數(shù)據(jù)恢復(fù)。存儲在HDFS上的文件,存儲機(jī)制及數(shù)據(jù)安全性如何保證,主要由以下幾點決定:12HDFS各組件的參數(shù)配置NameNode配置參數(shù)為,.dir可以單獨定制定制,參數(shù)為namenode在core-site.xml的配置文件中配置,具體目錄可以自己定制,一般在生產(chǎn)環(huán)境中可以存儲在一塊空的比較大的磁盤上。在hdfs格式化的時候會生成一個dfs/name/current目錄里面存放著edits與fsimage文件。NameNode元數(shù)據(jù)本地磁盤存儲目錄配置13HDFS各組件的參數(shù)配置Datanode配置參數(shù)為,dfs,data.dir這個參數(shù)可以配置datanode節(jié)點可以配置到單獨的目錄在core-site.xml現(xiàn)實環(huán)境一臺服務(wù)器做datanode節(jié)點,在dfs/data/current/會生成一個以本機(jī)名字生成的一個BP文件下面有一個current/finalized錄,里面很多在向hdfs上傳文件時生成的block文件。偽分布時采用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年財務(wù)分析專業(yè)課程考試題目
- 2026年證券投資顧問從業(yè)資格認(rèn)證考試練習(xí)題
- 俄語就業(yè)前景分析
- 墻布阻燃性能話術(shù)
- 骨科護(hù)理質(zhì)量管理實踐
- 2026西安市胸科醫(yī)院招聘腎內(nèi)科醫(yī)師參考考試試題及答案解析
- 2026年廣西理工職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年江蘇農(nóng)牧科技職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試模擬試題及答案詳細(xì)解析
- 2026年蚌埠學(xué)院單招綜合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年廣東舞蹈戲劇職業(yè)學(xué)院單招職業(yè)技能考試模擬試題含詳細(xì)答案解析
- OEE的課件教學(xué)課件
- 混凝土施工作業(yè)環(huán)境管理方案
- 2025年四川省成都市武侯區(qū)中考物理二診試卷
- 光纖線路架設(shè)施工方案
- 2025年監(jiān)理工程師市政公用工程繼續(xù)教育考試題及答案
- 解讀慢性阻塞性肺病(GOLD)指南(2026)更新要點課件
- 公司職業(yè)病防治宣傳教育培訓(xùn)制度范文
- 消防維保安全保障措施及應(yīng)急預(yù)案
- 校外培訓(xùn)安全提醒五不要課件
- 高齡婦女孕期管理專家共識(2024版)解讀
- 2025年6月上海市高考語文試題卷(含答案詳解)
評論
0/150
提交評論