云計(jì)算課件-大連理工大學(xué) 網(wǎng)絡(luò)與信息化中心 于廣輝_第1頁
云計(jì)算課件-大連理工大學(xué) 網(wǎng)絡(luò)與信息化中心 于廣輝_第2頁
云計(jì)算課件-大連理工大學(xué) 網(wǎng)絡(luò)與信息化中心 于廣輝_第3頁
云計(jì)算課件-大連理工大學(xué) 網(wǎng)絡(luò)與信息化中心 于廣輝_第4頁
云計(jì)算課件-大連理工大學(xué) 網(wǎng)絡(luò)與信息化中心 于廣輝_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

心于廣輝?Google?Amazon?微軟Azure?Hadoop:Google云計(jì)算的開源實(shí)現(xiàn)?Eucalyptus:Amazon云計(jì)算的開源實(shí)現(xiàn)?阿里云平臺(tái)?新浪SAE平臺(tái)?Google業(yè)務(wù)lbe?Google文件系統(tǒng)GFS?分布式數(shù)據(jù)處理MapReduce?分布式鎖服務(wù)Chubby?分布式結(jié)構(gòu)化數(shù)據(jù)表Bigtable?分布式存儲(chǔ)系統(tǒng)Megastore?大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper?Google應(yīng)用程序引擎(演示)ne?GAE提供的分布式存儲(chǔ)服務(wù)基于BigTable技術(shù)?通過JavaJDO/JPA接口或Python數(shù)據(jù)庫標(biāo)準(zhǔn)接口訪問和操作?優(yōu)勢:成本低、支持伸縮、并發(fā)性好、易管理?采用樂觀的并發(fā)控制?GAE的應(yīng)用程序運(yùn)行時(shí)環(huán)境是一個(gè)可伸縮的Web程序運(yùn)行?可以使用Google提供的豐富的應(yīng)用服務(wù),如分布式存儲(chǔ)服e?應(yīng)用開發(fā)套件(SDK)能夠是開發(fā)人員在本地執(zhí)行開發(fā)測試任?EclipseGAE插件能夠極大簡化在Eclipse環(huán)境中的Web應(yīng)用開?GoogleDocs是基于Web的文字處理和電子表格程序,支持檔檢索Gmail效的電子郵件工具,支持即時(shí)消息、視頻聊天、?Google需要一個(gè)支持海量存儲(chǔ)的文件系統(tǒng)?是否可以在一堆廉價(jià)且不可靠的硬件上構(gòu)建可靠的分布式?為什么不使用當(dāng)時(shí)現(xiàn)存的文件系統(tǒng)??不同的工作負(fù)載,不同的設(shè)計(jì)優(yōu)先級(廉價(jià)、不可靠的硬件)le?GFS將容錯(cuò)的任務(wù)交給文件系統(tǒng)完成,利用軟件的方法解?GFS將服務(wù)器故障視為正?,F(xiàn)象,并采用多種方法,從多存儲(chǔ)的安全、保Master(主服務(wù)器):管理節(jié)點(diǎn),在邏輯上只有一個(gè),保存系統(tǒng)的元數(shù)據(jù),負(fù)責(zé)ChunkServer(數(shù)據(jù)塊服務(wù)器):負(fù)責(zé)具體的存儲(chǔ)工作。數(shù)據(jù)以文件的形式存kServerver?Client與Master之間只有控制流,而無數(shù)據(jù)流,極大地降低?Client與ChunkServer之間直接傳輸數(shù)據(jù)流,同時(shí)由于文件被分成多個(gè)Chunk進(jìn)行分布式存儲(chǔ),Client可以同時(shí)訪問多個(gè)ChunkServer,從而使得整個(gè)系統(tǒng)的I/O高度并行,系統(tǒng)整體性能得到提高。?第三種元數(shù)據(jù)信息保存在各個(gè)ChunkServer上,Master故障NameSpace,文件系統(tǒng)目錄結(jié)構(gòu)Chunk副本的位置信息?采用副本方式實(shí)現(xiàn)ChunkServer容錯(cuò)?每一個(gè)Chunk有多個(gè)存儲(chǔ)副本(默認(rèn)為三個(gè)),分布存儲(chǔ)在不rGFSChunkServer撲、機(jī)架的的成本不斷下降,采用副最有效,而且實(shí)現(xiàn)的難度也最?Simple,andgoodenough!?ChunkServer存儲(chǔ)的是Chunk的副本,副本以文件的形式進(jìn)?每個(gè)Chunk又劃分為若干Block(64KB),每個(gè)Block對應(yīng)一個(gè)32bit的校驗(yàn)碼,保證數(shù)據(jù)正確(若某個(gè)Block錯(cuò)誤,則群群系統(tǒng)管理Sle?MapReduce?一種處理海量數(shù)據(jù)的并行編程模式,用于大規(guī)模數(shù)據(jù)集(通?適合非結(jié)構(gòu)化和結(jié)構(gòu)化的海量數(shù)據(jù)的搜索、挖掘、分析與?Google擁有海量數(shù)據(jù),并且需要快速處理?計(jì)算問題簡單,但求解困難?待處理數(shù)據(jù)量巨大(PB級),只有分布在成百上千個(gè)節(jié)點(diǎn)上?還提供了一個(gè)簡?這就是MapReduceGoogleMapReduce架構(gòu)設(shè)計(jì)師JeffreyDeanMapMapReduceMapMapReduceMMapRReduce?Map函數(shù)——對一部分原Map之間是互相獨(dú)立的,化?Reduce操作——對每個(gè)MapkeyvalueMap作ucekeyvalue?Map的輸入?yún)?shù)指明了需要處理哪部分?jǐn)?shù)據(jù),以“<在文本Map處,得?(1)輸入文件分成M塊,每塊大概16M~64MB(可以通分派處理程序?(2)M個(gè)Map任務(wù)和R個(gè)Reduce任務(wù)需要分派,Master選educe?(3)Worker讀取并處理相關(guān)輸入塊,Map函數(shù)產(chǎn)生的中?(4)中間結(jié)果定時(shí)寫到本地硬盤,分區(qū)函數(shù)將其分成R個(gè)erReduceWorker?(5)當(dāng)Master通知執(zhí)行Reduce的Worker關(guān)于中間<key,value>對的位置時(shí),它調(diào)用遠(yuǎn)程過程,從MapWorker的本地硬盤上讀取緩沖的中間數(shù)據(jù)。當(dāng)ReduceWorker讀到所有的中間數(shù)據(jù),它就使用中間key進(jìn)行排序,這樣可使相同key的值都在一起?(6)ReduceWorker根據(jù)每一個(gè)唯一中間key來遍歷所有的key結(jié)果值集合傳ReduceReduce個(gè)?(7)當(dāng)所有的Map任務(wù)和Reduce任務(wù)都完成的時(shí)候,?PageRank是一種由搜索引擎根據(jù)網(wǎng)頁之間相互的超鏈接計(jì)算的技術(shù)。Google用它來體現(xiàn)網(wǎng)頁的相關(guān)性和重要性。Google于1998年在斯坦?PageRank通過網(wǎng)絡(luò)浩瀚的超鏈接關(guān)系來確定一個(gè)頁面的等GoogleAB面的鏈接解釋為A頁面給B頁面投票,Google根據(jù)投票來源(甚至來源的來源,即鏈接到A投票目標(biāo)的等級來決定新的等級。簡單的頁面可以使其他低等級頁面的等級提不斷迭代直至收斂rceofImageLin?Map任務(wù)輸入(URL,content)對進(jìn)行map?PRinit是URL初始的PageRank值?list-of-urls包含URL所指向的所有網(wǎng)頁Reduce只是驗(yàn)證函數(shù)?Reduce任務(wù)輸入(URL,url_list)和許多(URL,val)值?計(jì)算vals并且計(jì)算d來獲得新的PR值?輸出(URL,(new_rank,url_list))非并行地檢查是否收斂Master地Master地pReduceMasterMaster性地點(diǎn)(checkpoint)?Google設(shè)計(jì)的提供粗粒度鎖服務(wù)的一個(gè)文件系統(tǒng),它基于問題SigtableChubbyChubby在內(nèi)?Google內(nèi)部還使用Chubby進(jìn)行名字服務(wù)(NameServer)?一種建議性的鎖而不是強(qiáng)制性的鎖;具有更大的靈活性?LeslieLamport最先提出的一種基于消息傳遞(MessagesPassing決分布式系統(tǒng)中的一致性問題統(tǒng)執(zhí)行相同的操作全一致的,并且進(jìn)發(fā)做求夠列?proposers提出決議(Value,s((1)決議只有被proposers提出后才((2)每次只批準(zhǔn)一個(gè)決議((3)只有決議確定被批準(zhǔn)后learners系統(tǒng)設(shè)計(jì)目標(biāo)系統(tǒng)設(shè)計(jì)目標(biāo)生器?Chubby系統(tǒng)本質(zhì)上就是一個(gè)分布式的、存儲(chǔ)大量小文件的完成Chubby用戶通過打開、關(guān)閉和讀取文件,獲取共享(Shared)鎖或獨(dú)占 ve申請打開某址寫入這個(gè)服務(wù)器的地址信息?需要存儲(chǔ)的數(shù)據(jù)種類繁多:Google目前向公眾開放的服務(wù)URL頁內(nèi)Google處通的系統(tǒng)根本無?商用數(shù)據(jù)庫無法滿足Google的需求:一方面現(xiàn)有商用數(shù)據(jù)Google苛刻服會(huì)給后期的系gtableegtable?Bigtable是一個(gè)分布式多維映射表,表中的數(shù)據(jù)通過一個(gè)行關(guān)鍵字(RowKey)、一個(gè)列關(guān)鍵字(ColumnKey)以及一個(gè)時(shí)間戳(TimeStamp)進(jìn)行索引?Bigtable對存儲(chǔ)在其中的數(shù)據(jù)不做任何解析,一律看做字符串“<html>…”“<html>…”html…”t3 t5tt9 t“CNN”“CNN.com”?行Bigtable超過具有原子性 用的是詞典?一個(gè)典型實(shí)例,其中n.www就是一個(gè)行關(guān)鍵字。不直接存是Bigtable的一個(gè)巧妙設(shè)計(jì)。這樣做至少析?倒排便于數(shù)據(jù)壓縮,可以大幅提高壓縮率?列Bigtable織成所謂的列族(ColumnFamily),每個(gè)族中的數(shù)據(jù)都屬于同一一起保存。引入了列族語法規(guī)則來定義:?族名:限定詞(family:quali?er)?族名必須有意義,限定詞則可以任意選定?圖中,內(nèi)容(Contents)、錨點(diǎn)(Anchor)都是不同的族。而cnnsicommylookca詞?族同時(shí)也是Bigtable中訪問控制(AccessControl)基本單元,“<html>…”“<html>…”“<html>…”t3 t5tt9 t“CNN”“CNN.com”?時(shí)間戳Google都需的數(shù)據(jù)版本必須通過時(shí)間tBigtable時(shí)間戳是64位整型統(tǒng)默認(rèn)的方式,也可以用戶N數(shù)據(jù)模型采取的就是這。另一種就是保留限定存最近10天的所有不同Bigtable回收機(jī)制自動(dòng)處“<html>…”“<“<html>…”“<html>…”t3 t5tt9 t“CNN”“CNN.com”Bigtable主服務(wù)器及Bigtable子表服務(wù)器Bigtable子表服務(wù)器GoogleBigtable主服務(wù)器及Bigtable子表服務(wù)器Bigtable子表服務(wù)器GoogleWorkQueueBigtableBigtable客戶端Bigtable客戶端庫執(zhí)行Open()Bigtable子表服務(wù)器hubby日志日志組?在互聯(lián)網(wǎng)的應(yīng)用中,為了達(dá)到好的可擴(kuò)展性,常常會(huì)采用oSQLNotOnlySQLNoSQL使用QLJOINNOSQL盤,或者把隨機(jī)存儲(chǔ)?Google設(shè)計(jì)和構(gòu)建了用于互聯(lián)網(wǎng)中交互式服務(wù)的分布式存儲(chǔ)系統(tǒng)Megastore,該系統(tǒng)成功的將關(guān)系型數(shù)據(jù)庫和NoSQL的特點(diǎn)與優(yōu)勢進(jìn)行了融合。?Megastore底層依賴于BigTable。Paxos距,將整個(gè)大的區(qū)連同它自身的NoSQLBigtable中 ps組(EnhtyGroup,相當(dāng)于分 ?傳統(tǒng)的關(guān)系型數(shù)據(jù)庫是通過連接(Join)來滿足用戶的需e升要比使用Megastore讀移到寫操作上Bigtable(HierarchicalData)是很方便的toreilurltoo?Megastore在Google中?從圖中可以看出,絕的可用性(>99.999%ore)。?應(yīng)用程序平均寫入延間?Megastore已經(jīng)是Google相對過時(shí)的存儲(chǔ)技術(shù)。Google目前正在使用的存儲(chǔ)系統(tǒng)是Spanner架構(gòu)?Spanner的設(shè)計(jì)目標(biāo)是能夠控制一百萬到一千萬臺(tái)服務(wù)器?Spanner最強(qiáng)大之處在oogleGoogleGoogle后臺(tái)子系統(tǒng),?廣泛可部署性的必然要求。監(jiān)控系統(tǒng)的開銷越低,對于原愿意接受這個(gè)?如果監(jiān)控系統(tǒng)的使用需要程序開發(fā)人員對其底層的一些細(xì)系統(tǒng)肯定不是一?Google的服務(wù)增長速度是驚人的,設(shè)計(jì)出的系統(tǒng)至少在未ogle (1)選擇監(jiān)控對象(起止時(shí)間、區(qū)分監(jiān)控模式的信息及一個(gè)衡量開銷的標(biāo)準(zhǔn))(2)用戶對這些執(zhí)行模式進(jìn)行(3)分布式執(zhí)行模式圖形化描(4)根據(jù)最初選擇的開(5)用戶選擇了某個(gè)監(jiān)控樣所謂的監(jiān)控審raceInspection?GoogleAppEngine是一個(gè)由Python應(yīng)用服務(wù)器群、BigtableGFS為開發(fā)者提服務(wù)ogleappspotcom服Google它提供服務(wù)且不需要承前端和靜態(tài)文件應(yīng)用服務(wù)器服務(wù)器群gine前端和靜態(tài)文件應(yīng)用服務(wù)器服務(wù)器群gine應(yīng)用管理節(jié)點(diǎn)?沙盒—GoogleAppEngine為每個(gè)應(yīng)用程序提供了一個(gè)安全?Python運(yùn)行時(shí)環(huán)境—GoogleAppEngine支持Java和Python語Python網(wǎng)絡(luò)應(yīng)用程序框架?數(shù)據(jù)庫——分布式存儲(chǔ)數(shù)據(jù)庫DataStore?Google賬戶——開發(fā)應(yīng)用程序必須擁有一個(gè)Google賬戶?AppEngine服務(wù)——GoogleAppEngine提供的基本服務(wù)?開發(fā)流程——GoogleAppEngine開發(fā)應(yīng)用程序必須遵守一?配額和限制——Google賬戶提供的免費(fèi)空間和流量有一定持久存儲(chǔ)的空間。平臺(tái)可支持一些基本操作,如查詢、?可以對用戶的身份進(jìn)行驗(yàn)證,并且支持使用Google賬戶發(fā)?有一個(gè)功能完整的本地開發(fā)環(huán)境,可以在自身的計(jì)算機(jī)上Engine?支持在指定時(shí)間或定期觸發(fā)事件的計(jì)劃任務(wù)?Python運(yùn)行時(shí)環(huán)境包括Python標(biāo)準(zhǔn)庫,開發(fā)人員可以調(diào)用沙盒限制的庫方法(嘗試打開套接字、向文件進(jìn)行寫入操作等),為便gleAppEngineC將不受系統(tǒng)支持?Python環(huán)境為開發(fā)平臺(tái)中的數(shù)據(jù)庫、Google賬戶、網(wǎng)址抓PI?GoogleAppEngine還提供了一個(gè)簡單的Python網(wǎng)絡(luò)應(yīng)用程?用戶應(yīng)用程序只能通過GoogleAppEngine提供的網(wǎng)址抓取APIAPI訪問互聯(lián)網(wǎng)中其他計(jì)算機(jī);只能HTTP或HTTPS來進(jìn)行?應(yīng)用程序無法對GoogleAppEngine的文件系統(tǒng)進(jìn)行寫入操該應(yīng)用程序必DataStore續(xù)存在?應(yīng)用程序只有在響應(yīng)網(wǎng)絡(luò)請求時(shí)才運(yùn)行,且響應(yīng)時(shí)間必須極短(幾秒之內(nèi)完成)。同時(shí),請求處理的程序不能在自?使用SDK時(shí),可以在本地計(jì)算機(jī)上模擬包括所有GoogleAppgineSDKGoogleAppEngineAPI盒環(huán)境?使用Python實(shí)現(xiàn),這個(gè)開發(fā)套件可以在裝有的任何平臺(tái)上面運(yùn)行,包括Windows、MacOSX和Linux等,開發(fā)人員可以在Python網(wǎng)站上獲得適合自己系統(tǒng)的Python?該開發(fā)套件還包括將應(yīng)用程序上傳到GoogleAppEngine之序的代碼、靜態(tài)文件和配具將數(shù)據(jù)上傳到平臺(tái)上面?系統(tǒng)中有一個(gè)管理控制臺(tái),這個(gè)管理控制臺(tái)有一個(gè)網(wǎng)絡(luò)接s?resize(width=0,height=0):該方法用來縮放圖像?crop(ler_x,top_y,right_x,bosom_y):該方法可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論