付費下載
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 1,BlockManager 3,BlockManager層的數(shù)據(jù)傳輸服務的初始化過一,BlockManager 涉及的各個角BlockManager Master-slaves 結構。Driver BlockManagerMaster 會管理所有Executor 中的 BlockManager Executor 啟動時, 會啟動相應BlockManager 并 1,BlockManager 3,BlockManager層的數(shù)據(jù)傳輸服務的初始化過一,BlockManager 涉及的各個角BlockManager Master-slaves 結構。Driver BlockManagerMast
2、er 會管理所有Executor 中的 BlockManager Executor 啟動時, 會啟動相應BlockManager 并其次,BlockManager 提供和寫數(shù)據(jù)的接口,可以從本地讀寫數(shù)據(jù),也可以 Tachyon)。1,在Application 啟動時會在SparkEnv 在內(nèi)存、磁盤以及 OffHeap(堆外空間,BlockManagerMaster 以及BlockManagerMaster:對整個集群所有Block 數(shù)據(jù)進行管理的;主要是管理方法的輸出的給去管理所有節(jié)點的BlockManager;block 信息的數(shù)3 ExecutorBackend BlockManager
3、 在給BlockManagerMaster;實質(zhì)上Executor 中的 BlockManager 在啟動的時給4,MemoryStore 是 BlockManager 中專門負責內(nèi)存數(shù)和讀寫的類5,DiskStoreBlockManager和讀寫的類; DiskBlockManagerLogicBlockDiskPhysicalBlock 7,OneForOneBlockFetcher 用來連接到相應BlockManager 去獲取數(shù)據(jù) 二,blockManager spark 1,sparkShuffle 過程數(shù)據(jù)會被BlockManager 管理。Reduce 端去發(fā)請求獲取2,spar
4、k broadcast 數(shù)3,Spark Streaming receiver 模式下接受到的數(shù)據(jù)都會被放到BlockManager,然后產(chǎn)生的時候去獲取4,rdd cache 操作,最終也是用BlockManager 進行數(shù)于管理運行結果,也BlockManager(resultSize=akkaFrameSize-第一層通訊框rpc -block 信 第二層文件傳輸-使BlockManager 進行數(shù)據(jù)傳 浪三,BlockManager 在RDD 層面了解到RDD 是由不同的partition 組成的action partition 上面進行的;而storage 模,RDD 又被視為由不R
5、DD 的存取是block 為的角度不同。在Sparkstorage 模塊進行的,本質(zhì)上partition 和block 是等價的,只是 浪三,BlockManager 在RDD 層面了解到RDD 是由不同的partition 組成的action partition 上面進行的;而storage 模,RDD 又被視為由不RDD 的存取是block 為的角度不同。在Sparkstorage 模塊進行的,本質(zhì)上partition 和block 是等價的,只是是block,所有的操作都是block BlockManager 對象被創(chuàng)建的時候會創(chuàng)建出 MemoryStore DiskStore 對象用以
6、存取blockspill 磁盤中, 通過 DiskStore 。四,BlockManager PUT GET GETPut 接口和Get 接口兩個中存在就直接返回, 從本地獲取一個 Block, 會先判斷如果是useMemory, 直接從內(nèi)存中取出, 如果是 useDisk, 會從磁盤中取出返回, useMemory 判斷是否在內(nèi)存中緩存一下,方便下次獲取, 如果 local 不存在, 上獲取, 當然元信息是存在 drive 上的,要根 PUT 操作 ,級別, 對應的是 memoryStore 還是 diskStore, 五,blockManager blockTransferService
7、spark rpc 傳輸使用的是 netty, netty, 這里的大文件傳輸其實走的是 netty, 動 blockManager 的時候會啟動一個 blockTransferService 服務, 這個服務就是用來傳輸大文件用的對應的具體類是 NettyBlockTransferService這個實例中也會有 BlocakManager的 啟動一個NettyBlockRpcServer的用, 用來提供服務, BlocakManager 根據(jù) ManagedBuffer 對象,nettyHandler, 也擁BlocakManager 的BlockId 獲取一個Block 然后包裝為一個當需
8、要從遠端獲取一個 Block 的時候,就需要 blockTransferService driver 上獲取到fetchBlocks 方法其他真正Block 的真 nt, fetchOneForOneBlockFetcherFetcher k fetch, k Block COpenBlocks BlockId, 其他節(jié)點服務BlockId blockManager 中拿到數(shù)據(jù)后用來傳輸用的是 如果是備份的時候同步上傳一個含 Block, 其他節(jié)點服務端會根據(jù),uploadBlock 消息中BlockId, 浪 kFetch 也有一個類似 Stream 的概念, kFetch 的對象是“ 一個
9、內(nèi)存中IteratorManagedBuffer”,即一組Buffer,每一個Buffer 對應一個 kFetch 也有一個類似 Stream 的概念, kFetch 的對象是“ 一個內(nèi)存中IteratorManagedBuffer”,即一組Buffer,每一個Buffer 對應一個 kId,ServerkIdC ntStream kFetchServer StreamIDStreamManagerkopenStream口來分別響應 kFetch Stream 兩種操作,并且針對 Server kFetch registerStream 接口來BufferBlockManager BlockI
10、D 對應的StreamManager,從而支Block Fetch 六,rdd Block RDD 的運算是基于 partition, 每個 task 分區(qū)上一個 stage 那么是在哪里變task executorBlock 以 看看這個轉(zhuǎn)變過接七,RDDRDDuseDisk、useMemory、deserialized、replication 11 JVM 中. MEMORY_AND_DISK:以反序列化的JAVA 對象的方在JVM 中如果內(nèi)存不夠。的一些分區(qū)將將會緩存在磁盤上,再次需要的時候從磁 ). 反序列化的方式,這樣更高效的利用空間, 尤其是使用快速序列化時。但是 CPU 操put
11、eT(rd d: RDDT,context:storageLevel:StorageLevel):IteratorT=logDebug(sLookingfor partitionfinaldefiterator(split:Partition,context:TaskContext):IteratorT pute(this, split, context,else(split, MEMORY_AND_DISK_SERMEMORY_ONLY_SER相似, 在DISK_ONLY:RDD 在磁盤 OFF_HEAP (experimental) : 將 MEMORY_AND_DISK_SERMEMORY_ONLY_SER相似, 在DISK_ONLY:RDD 在磁盤 OFF_HEAP (experimental) :
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 染色體變異生物課件
- 2024-2025學年山西省運城市高二下學期期中考試歷史試題(解析版)
- 2024-2025學年山東省臨沂市河東區(qū)、費縣高二下學期期中聯(lián)考歷史試題(解析版)
- 2026年虛擬現(xiàn)實VR開發(fā)工程師考試題目及答案
- 2026年國際貿(mào)易實務國際市場分析與營銷策略測試題
- 2026年程序設計基礎語言CC試題
- 2026年化學實驗技術化學分析測試方法與技術題集
- 2026年國際關系國際政治經(jīng)濟合作題庫集
- 2026年文化研究與文化現(xiàn)象解讀問題集
- 2026年法律行業(yè)律師資格考試案例分析題
- 【語文】太原市小學一年級上冊期末試題(含答案)
- 儲能電站員工轉(zhuǎn)正述職報告
- 靜脈炎處理方法
- 醫(yī)院網(wǎng)絡安全建設規(guī)劃
- 不銹鋼護欄施工方案范文
- 商業(yè)地產(chǎn)物業(yè)管理運營手冊
- 2025及未來5年中國天然植物粉市場調(diào)查、數(shù)據(jù)監(jiān)測研究報告
- 焦爐安全生產(chǎn)規(guī)程講解
- 關鍵崗位人員風險管控與預警體系
- 加班工時管控改善方案
- (正式版)DB2327∕T 074-2023 《大興安嶺升麻栽培技術規(guī)范》
評論
0/150
提交評論