版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
-7-人工智能存儲平臺如何滿足機器學習和數(shù)據(jù)分析的需要機器學習和人工智能培訓通常以批處理模式運行,在此模式下,數(shù)據(jù)科學家可以創(chuàng)建機器學習人工智能模型,針對數(shù)據(jù)進行測試,并隨著時間推移完善模型。依據(jù)機器學習和人工智能任務的執(zhí)行方式以及如何在其環(huán)境中收集數(shù)據(jù)的方法,組織需要了解應當購買哪些人工智能存儲產(chǎn)品。
當組織購買人工智能存儲平臺時,有許多途徑可以遵循。但一個重要的目標應當是找到一種使其能夠更有效地收集數(shù)據(jù)產(chǎn)品,以執(zhí)行機器學習和人工智能任務。
評估和選擇人工智能數(shù)據(jù)存儲產(chǎn)品涉及的一些關鍵問題包括:
●存儲平臺必需供應高性能和可擴展性,并有效管理成本。
●其性能必需包括供應高吞吐量和實現(xiàn)低延遲。
?產(chǎn)生良好的人工智能模型意味著處理PB規(guī)模的數(shù)據(jù),這可能導致昂揚的成本。組織必需意識到需要管理機器學習和人工智能平臺的總體成本。
在深度學習中,機器學習算法可以在無監(jiān)督的狀況下運行,隨著深度學習算法的連續(xù)層處理多個級別的數(shù)據(jù)分析,I/O配置文件會導致高度隨機訪問。機器學習和人工智能培訓通常以批處理模式運行,在此模式下,數(shù)據(jù)科學家可以創(chuàng)建機器學習人工智能模型,針對數(shù)據(jù)進行測試,并隨著時間推移完善模型。這種方法要求低延遲以確??焖賵?zhí)行,由于更短的模型測試時間意味著更多的迭代和更好的模型。
因此,組織選擇的特定存儲產(chǎn)品應基于其所做的工作類型以及所需的機器學習和人工智能培訓。無論哪種狀況,獲得存儲產(chǎn)品的性價比都會有一些折衷。
分層方法
在購買任何存儲產(chǎn)品時,成本與性能是一個關鍵考慮因素。假如有這個選擇,大多數(shù)組織都會購買速度盡可能快的存儲設備。然而,獲得更高性能需要付出更大的代價。通常,高性能系統(tǒng)不會擴展到數(shù)PB的范圍內。加上假設隨時分析的數(shù)據(jù)工作集將成為整個數(shù)據(jù)資產(chǎn)的子集,很簡單看出存儲分層是設計機器學習和人工智能數(shù)據(jù)存儲的必要部分。
在機器學習和人工智能的背景下,分層究竟意味著什么?傳統(tǒng)的分層產(chǎn)品從固定存儲池進展為簡單系統(tǒng),依據(jù)使用頻率和可用池容量優(yōu)化單個存儲塊的位置。但是由于數(shù)據(jù)的處理方式,這種方法并不能很好地滿意機器學習和人工智能的要求。
自動化分層產(chǎn)品假定數(shù)據(jù)經(jīng)過對業(yè)務特別重要的生命周期。新的數(shù)據(jù)是特別重要的,并且將被頻繁訪問。隨著時間的推移,數(shù)據(jù)的價值漸漸降低,它可以移動到成本更低、性能更低的產(chǎn)品存儲中。
用于機器學習和人工智能分析的數(shù)據(jù)使不同的整個數(shù)據(jù)集變?yōu)榛顒訝顟B(tài)并用于分析,同時需要在任何時候使用整個數(shù)據(jù)集。這意味著使用中的數(shù)據(jù)必需位于性能全都的存儲層上,由于訪問中的任何變化都會影響模型訓練等問題。
機器學習和人工智能模型開發(fā)中的數(shù)據(jù)處理的隨機性,意味著試圖隨著時間動態(tài)重新平衡數(shù)據(jù)的反應性存儲平臺算法將不起作用。這些算法假設一個規(guī)模較小且相對靜態(tài)的工作集,該工作集隨時間的推移而漸漸變化。在機器學習和人工智能中,數(shù)據(jù)訪問配置文件將更加隨機,因此很難猜測要緩存哪些數(shù)據(jù)以及如何調整緩存大小或更快的存儲層。
兩層存儲模型
為機器學習和人工智能工作負載供應存儲的一個簡潔方法是簡潔地使用兩層模型。性能層供應盡可能多的性能和盡可能低的延遲,同時針對系統(tǒng)預期要處理的最大數(shù)據(jù)集進行調整。
高性能的閃存價格昂貴,并且隨著市場向三級和四級單元之類的容量閃存產(chǎn)品進展,高性能存儲產(chǎn)品消失了一個新市場,其中包括低延遲閃存產(chǎn)品,如三星Z-NAND和東芝XL閃存。這些產(chǎn)品補充了通過供應低延遲I/O來開發(fā)的存儲級內存。例如,VastData同時使用四層單元和IntelOptane技術,為N結構和S3API供應支持,為非結構化數(shù)據(jù)供應高性能、可擴展的存儲產(chǎn)品。
這些第0層存儲產(chǎn)品使用NVMe設備在內部或跨存儲網(wǎng)絡進行連接。與傳統(tǒng)的SAS和SATA存儲設備相比,NVMe優(yōu)化了I/O堆?;騃/O協(xié)議。其結果是更低的延遲和更大的吞吐量,但是由于服務器處理器不需要等待I/O完成的時間,顯著提高了平臺利用率。
PureStorage公司的AIRI,適用于人工智能的IBMSpectrumStorage和NetApp公司AllFlashFASA800之類的產(chǎn)品都在內部使用NVMe以獲得最高的媒質性能。DellEMC公司和DataDirectNetworks公司使用其產(chǎn)品線中的橫向擴展文件系統(tǒng)產(chǎn)品來支持機器學習和人工智能參考架構。
容量層需要平安地長期存儲全部人工智能模型數(shù)據(jù),通常是數(shù)月或數(shù)年的時間。因此,具有高度耐久性的可擴展存儲平臺對于管理機器學習和人工智能所需的大量數(shù)據(jù)至關重要。對象存儲市場已經(jīng)進展到生產(chǎn)一系列高度可擴展和耐用的人工智能存儲產(chǎn)品。
耐久性究竟是什么?
在典型的存儲系統(tǒng)中,使用將冗余構建到硬盤上存儲的數(shù)據(jù)中的架構來愛護數(shù)據(jù)。假如單個組件發(fā)生故障,則替換了發(fā)生故障的組件后,會使用額外的數(shù)據(jù)副本從丟失數(shù)據(jù)中恢復并重建數(shù)據(jù)。盡管RAID5和更高版本為硬盤故障供應了愛護,但仍需要其他系統(tǒng)來防備大規(guī)模災難,例如數(shù)據(jù)中心中斷。隨著傳統(tǒng)系統(tǒng)規(guī)模的擴大,長久性或減輕數(shù)據(jù)丟失的成本很高。
糾刪編碼將冗余構建到數(shù)據(jù)中,因此,硬盤、服務器甚至整個數(shù)據(jù)中心的中斷或故障都不會造成數(shù)據(jù)丟失。擦除編碼數(shù)據(jù)的分散性質意味著可以構建存儲系統(tǒng)以通過本地和地理數(shù)據(jù)愛護擴展多PB的數(shù)據(jù),而無需管理多個系統(tǒng)的開銷和成本。
對象存儲為必需長期(通常為多年)保留的數(shù)據(jù)供應可擴展性和長久性。但是,為了獲得成本優(yōu)勢,對象存儲產(chǎn)品是基于具有某些緩存功能的基于硬盤的廉價存儲構建的。這使得它們不太適合機器學習和人工智能數(shù)據(jù)的日常處理,但對于長期保存卻特別適合。
地理位置分散的對象庫還使來自多個位置和來源的數(shù)據(jù)能夠從多個位置和來源提取和訪問。例如,假如數(shù)據(jù)處理使用內部部署和公共云基礎設施的混合,則這可能很有價值。地理分散是ScalityRing平臺的功能,該平臺與HPE公司和WekaIO公司產(chǎn)品集成在一起以創(chuàng)建兩層存儲架構。
混合存儲架構
企業(yè)面臨的挑戰(zhàn)是如何實現(xiàn)包含高度可擴展和高性能存儲的混合體系結構。對象存儲系統(tǒng)使組織能夠存儲大多數(shù)的數(shù)據(jù),而某些產(chǎn)品則使用性能節(jié)點,這些節(jié)點將活動數(shù)據(jù)存儲在具有高性能閃存的服務器上。這種方法的優(yōu)點是,可以將容量或性能節(jié)點添加到產(chǎn)品中,以便在任何方向上進行擴展。例如,Cloudian公司供應了可擴展性功能的硬件設備。
從高性能存儲構建的系統(tǒng)必需設計為可針對正在處理的整個數(shù)據(jù)集進行擴展。在這些場景中,隨著時間的推移,多個人工智能數(shù)據(jù)集被處理,數(shù)據(jù)在高性能平臺之間來回移動。
存儲架構必需能夠為人工智能產(chǎn)品供應在存儲器之間來回移動數(shù)據(jù)所需的網(wǎng)絡帶寬,并滿意人工智能平臺的要求。NvidiaDGX-1和DGX-2平臺等產(chǎn)品每秒可消耗數(shù)十GB的數(shù)據(jù)。因此,為了跟上進展的步伐,人工智能數(shù)據(jù)存儲產(chǎn)品中計算與存儲之間的連接必需是低延遲的InfiniBand或100Gb以太網(wǎng)。
人工智能產(chǎn)品的軟件定義存儲
為機器學習和人工智能構建存儲并不肯定意味著部署更高性能的設備。新的高性能人工智能存儲產(chǎn)品是可用的,基本上是軟件定義存儲(SDS)。這些產(chǎn)品利用了新媒介的性能,包括NVMe,在某些狀況下還包括長久內存或存儲類內存。
軟件定義存儲(SDS)產(chǎn)品的優(yōu)勢之一是它們適用于公共云,由于它們可以在公共云基礎設施中實例化和動態(tài)擴展。當不知道基礎設施的數(shù)量或只需要很短的時間時,這種操作模式可能很有吸引力。
WekaIO公司供應了基于Matrix軟件的橫向擴展存儲平臺,該平臺可以部署在具有NVMe驅動器的服務器上,也可以部署在具有NVMe功能的彈性計算云實例的AWS公共云中。
ExceleroNVMesh是另一個軟件定義存儲(SDS)產(chǎn)品,它可以跨多個服務器和存儲線性地擴展性能,并且通常與IBM公司的SpectrumScale結合起來創(chuàng)建一個擴展文件系統(tǒng)。
數(shù)據(jù)移動性
將容量和性能層組合到單個產(chǎn)品中需要人工或自動過程,以在性能和容量層之間移動數(shù)據(jù),并在元數(shù)據(jù)移動時在元數(shù)據(jù)之間勝利跟蹤數(shù)據(jù)。某些人工智能存儲產(chǎn)品可以直接與對象存儲集成,從而簡化了此過程。公共云可以作為機器學習和人工智能開發(fā)的強大選擇,由于在內部云服務之間移動的數(shù)據(jù)不會產(chǎn)生存儲費用。例如,WekaIO公司的Matrix可以在內部和外部復制數(shù)據(jù),并將其存檔到對象存儲中。
集成在一起
想要為機器學習和人工智能工作負載實現(xiàn)本地存儲的企業(yè)必需考慮容量和性能。對于性能層,他們可以從頭開頭構建,也可以部署一個打包的產(chǎn)品,用于機器學習的融合基礎設施。使用構建選項,企業(yè)可以部署內部設備或使用軟件定義存儲(SDS)。軟件定義存儲(SDS)使組織能夠將存儲作為一個單獨的層來實現(xiàn),或
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鞋類設計師操作規(guī)范知識考核試卷含答案
- 自來水筆制造工安全培訓效果模擬考核試卷含答案
- 巷道掘砌工崗前決策判斷考核試卷含答案
- 自然水域救生員崗前工作標準化考核試卷含答案
- 煉焦工安全宣貫模擬考核試卷含答案
- 玻璃及玻璃制品成型工創(chuàng)新意識競賽考核試卷含答案
- 2024年鄭州升達經(jīng)貿(mào)管理學院輔導員考試參考題庫附答案
- 氧化擴散工安全宣貫評優(yōu)考核試卷含答案
- 2025呼和浩特托克托縣招聘社區(qū)工作者及儲備人員筆試通知備考題庫附答案
- 燒結球團原料工崗前基礎實戰(zhàn)考核試卷含答案
- 2026年重慶市江津區(qū)社區(qū)專職人員招聘(642人)筆試備考試題及答案解析
- 2026年思明區(qū)公開招聘社區(qū)工作者考試備考題庫及完整答案詳解1套
- 【四年級】【數(shù)學】【秋季上】期末家長會:數(shù)海引航愛伴成長【課件】
- 小學音樂教師年度述職報告范本
- 設備設施風險分級管控清單
- 河南交通職業(yè)技術學院教師招聘考試歷年真題
- 污水管網(wǎng)工程監(jiān)理規(guī)劃修改
- (機構動態(tài)仿真設計)adams
- 北京市社保信息化發(fā)展評估研究報告
- GB/T 8336-2011氣瓶專用螺紋量規(guī)
- GB/T 1048-2019管道元件公稱壓力的定義和選用
評論
0/150
提交評論