下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、高性能計算軟件鏡像高性能計算/軟件鏡像高性能計算/軟件鏡像 PAGE 4 PAGE 4軟件鏡像深度學習和HPC工具集用戶手冊專為阿里云GPU物理機定制的深度學習和HPC工具集,在阿里云Docker Hub上發(fā)布。阿里云官方DockerHub地址 HYPERLINK /search.html /search.html訪問hub可以查看阿里云提供的鏡像以及緩存的社區(qū)公開鏡像;進入控制臺可以創(chuàng)建和管理自己的docker鏡像。新用戶第一次使用阿里云Docker服務,用戶需要先注冊成為開發(fā)者,步驟如下:打開上面的阿里云Docker Hub,未登陸的,先使用云賬號登錄,登錄/注冊在左上角;點擊右上角管理中
2、心,如下圖:對新用戶會彈出去注冊開發(fā)者的頁面:注冊成功之后,點擊進入管理控制臺,下次進入也可以在Docker Hub頁面,點擊右上角管理中心進入。界面如下:選擇左側(cè)的Docker服務下面的鏡像管理標簽,新用戶會提示設置自己的鏡像倉庫命名空間和密碼。命名 空間是私人鏡像的地址前綴。完成設置之后,可以開始使用阿里云Docker倉庫。Dockerdocker阿里云官方docker倉庫地址為: registry . aliyuncs . com (公網(wǎng)) 在GPU物理機上,對應替換為內(nèi)網(wǎng)地址: registry - internal . aliyuncs . com (內(nèi)網(wǎng)) HelloWorld(G
3、PU物理機預裝CentOS 7系統(tǒng),以下操作僅以CentOS 7為例,且使用root用戶) 首先檢查機器上安裝的docker服務狀態(tài):# docker info正常會顯示當前存儲空間等信息。如果出錯,請先嘗試重啟docker服務:# systemctl restart docker下一步,使用阿里云賬號和之前設定的docker倉庫密碼,登錄阿里云docker倉庫:docker login Hello World:# docker run /alicloudhpc/hello-world 如果一切正常,說明機器的docker服務運行正常。使用深度學習和HPC工具集需要使用GPU的用戶,最好先檢查
4、物理機上的GPU狀態(tài)是否正常,運行:# nvidia-smi 或者:# /usr/local/cuda/samples/1_Utilities/deviceQuery/deviceQuery 列出兩塊NVidia K40卡為正常。工 具 集 的 發(fā) 布 地 址 是 : HYPERLINK /detail.html?repoId=2 /detail.html?repoId=2 列出了包含的軟件工具和簡介。docker login之后,可以下載toolkit的鏡像到本地:# docker pull /alicloudhpc/toolkit 重命名一個短名稱:# docker tag /aliclo
5、udhpc/toolkit toolkit因為需要在docker容器中使用gpu設備,啟動docker容器需要設定額外參數(shù)。推薦將如下內(nèi)容保存到一個shell腳本(比如run-toolkit.sh),方便以后運行: #!/bin/bash DOCKER_BIN = /usr/bin/docker INTERACT = -ti #INTERACT=-d DATA_VOLUME = /disk1 DATA_MOUNT_POINT = /disk1 MEM_LIMIT = 96g set - e if $ # -lt 2 ; then echo Usage: $0 image command exi
6、t - 1elseIMAGE=$1shift1CMD=$fidevices=$(ls- 1 / dev | grep nvidia ) dev_param = for d in $devices ; do dev_param = $dev_param - device=/dev/$ddonetime_param=-v/etc/localtime:/etc/localtime:ro if!-z$CUDA_VISIBLE_DEVICES;thendev_env=-eCUDA_VISIBLE_DEVICES=$CUDA_VISIBLE_DEVICES else dev_env = fi exec $
7、DOCKER_BIN run $INTERACT - P $dev_env $dev_param $time_param - m $MEM_LIMIT - v $DATA_VOLUME : $DATA_MOUNT_POINT $IMAGE $CMD 運行腳本,啟動toolkit: # chmod +x run-toolkit.sh # ./run-toolkit.sh toolkit /bin/bash 成功運行之后,已經(jīng)進入交互式的docker容器(理解為一個與host隔離的運行環(huán)境)中,物理機上的 /disk1 /disk1/disk1(如果容器銷毀,其他數(shù)據(jù)不會保留)。檢查GPU工作正常
8、:# nvidia-smi檢查通過以后,您可以像普通終端一樣,運行軟件。重新進入在交互式docker容器中,如果您運行 exit,退出docker容器之后,該容器即停止。如果您在容器中修改了/disk1 以外的內(nèi)容(比如安裝軟件),下次還需要繼續(xù)使用,則不應該運行 run-toolkit.sh 新建容器,而是重啟原先的,操作如下:查詢已經(jīng)停止的容器id:# docker ps -a返回結(jié)果中,復制下需要重啟的容器的 container_id 重啟容器:# docker start container_id 成功則返回一串重復的id重新進入交互式docker容器:# docker attatch
9、 container_id使用進階獲得更新如果toolkit發(fā)布新的版本,可以重新pull獲得更新:# docker pull /alicloudhpc/toolkit 重命名一個短名稱:# docker tag /alicloudhpc/toolkit toolkit創(chuàng)建私有鏡像訪 問 阿 里 云 docker 控 制 臺 : /#/docker/image/list 可以創(chuàng)建自己的私有鏡像(選擇本地倉庫)。使用和創(chuàng)建本地鏡像的方法,可以參考docker官方文檔相關(guān)部分: HYPERLINK /userguide/dockerimages /userguide/dockerimages另外有一份中文教程: HYPERLINK /book/docker.html /
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防校園培訓課件
- 2026年電子商務運營師考試模擬題
- 2026年工業(yè)自動化與智能制造專業(yè)題集
- 2026年市場營銷模擬測試中級營銷策略實戰(zhàn)分析
- 2025年企業(yè)財務管理規(guī)范化操作手冊
- 2026年物流與供應鏈管理專業(yè)考試題集
- 2026年計算機二級C語言考試模擬題
- 2026年金融分析師CFA考試金融投資特色題庫
- 心理測試與咨詢專業(yè)題庫針對2026年心理從業(yè)者
- 交通運輸企業(yè)安全管理與應急處理手冊
- 建筑工程監(jiān)理服務承諾書范文
- 職業(yè)技術(shù)學院工業(yè)機器人技術(shù)高職技能考核標準1022(簡化版)
- 聲學基礎課后題答案
- 《肺部CT影像》課件
- 貴州省六盤水市2023-2024學年高二上學期1月期末質(zhì)量監(jiān)測數(shù)學試題(含答案)
- 科大訊飛招聘在線測評題
- 兒童性格發(fā)展與個性獨立性的培養(yǎng)
- 2024常壓儲罐檢驗人員能力評價導則
- 大學生預征對象登記表模板
- 胸外科-胸部創(chuàng)傷
- 2023版設備管理體系標準
評論
0/150
提交評論