版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
大學(xué)模型支撐平臺技術(shù)參數(shù)序號儀器設(shè)備名稱技術(shù)指標(biāo)參數(shù)(功能需求)數(shù)量單位1模型支撐平臺1、規(guī)格:機架式服務(wù)器,高度≤8U。2、處理器:支持≥2顆X86可擴展處理器,單顆處理器≥48核,基本主頻≥2.1GHZ,UPISPEED≥20GT/S,UPI鏈接數(shù)≥3。3、內(nèi)存容量:配置≥2048GB(≥32PCS*≥64GB,DDR5≥4800HZ)。4、內(nèi)存插槽:≥32個。5、硬盤:配置≥2塊≥960GBSATASSD,≥4塊≥7.68TBNVMESSD2.5IN。6、RAID卡:配置SAS和SATARAID卡。7、GPU:配置≥8塊GPU卡/芯片/AI處理器,單GPU卡/芯片/AI處理器配置顯存容量≥141GB,GPU卡/芯片/AI處理器算力覆蓋不少于FP64、FP32、FP16、INT8精度,單GPU卡/芯片/AI處理器FP64理論峰值算力(非TENSORCORE)≥30TFLOPS,單GPU卡/芯片/AI處理器FP32理論峰值算力(非TENSORCORE)≥60TFLOPS,單GPU卡/芯片/AI處理器FP16理論峰值算力≥1900TFLOPS,GPU卡/芯片/AI處理器間互聯(lián)帶寬≥900GB/S。8、IB卡:配置≥4個CONNECTX7NDR400G(單端口,含光模塊),≥2個CONNECTX6HDR200G(單端口,含光模塊)。9、網(wǎng)卡:配置≥1個25G雙端口網(wǎng)卡(含模塊),≥1個1GB(帶內(nèi)管理口)。10、電源:配置≥6個熱插拔電源模塊。11、配套異構(gòu)算力管理平臺,平臺功能要求如下:一、算力管理模塊:(1)支持異構(gòu)資源管理,支持國產(chǎn)AI算力芯片(包括但不限于昇騰、昆侖芯、海光),可實現(xiàn)英偉達(dá)及國產(chǎn)AI算力芯片(如昇騰、昆侖芯、海光)的顯存、算力切分。(2)支持與現(xiàn)有的2臺8卡A800的資源統(tǒng)一調(diào)度管理。(3)支持查看集群/節(jié)點的實時資源使用情況,包括GPU、CPU、內(nèi)存、磁盤的使用率和利用率。(4)支持設(shè)置統(tǒng)計時段,查看資源的平均使用情況、GPU、CPU、內(nèi)存的使用趨勢、以及GPU、CPU、內(nèi)存的使用峰值。(5)支持按團(tuán)隊維度統(tǒng)計服務(wù)器資源的分配情況,包括已分配資源(團(tuán)隊成員資源、子團(tuán)隊資源、共享資源等)和未分配資源,其中資源統(tǒng)計包括但不限于CPU,內(nèi)存,GPU等3種以上資源分配的統(tǒng)計。(6)支持按團(tuán)隊維度統(tǒng)計已分配的服務(wù)器資源的使用情況,包括已分配未創(chuàng)建容器、容器內(nèi)未使用以及容器實時使用資源。(7)支持按GPU、CPU的資源實時使用量、近三天平均使用率、近三天的空閑率等維度的排行榜。(8)支持查看節(jié)點監(jiān)控在線狀態(tài)、節(jié)點名稱、節(jié)點IP。(9)支持查看所有計算集群節(jié)點的GPU使用情況,包括顯卡數(shù)量、溫度、每張卡的顯存和實際使用顯存。(10)支持查看所有計算集群節(jié)點的CPU、內(nèi)存、磁盤的實時使用量以及資源總量。(11)支持用戶自定義報警閾值,支持集群、節(jié)點、團(tuán)隊、成員維度分別設(shè)置報警閾值;支持告警級別、告警抑制間隔、統(tǒng)計周期、有效時段等設(shè)置。(12)支持指定回收對象和回收集群,在設(shè)定的回收時間執(zhí)行回收任務(wù),資源回收將同步銷毀容器和重置資源分配值為0;支持定時回收和立即回收兩種模式。(13)支持查看計劃詳情以及執(zhí)行情況;在回收時間前修改和取消回收計劃;支持取消指定回收計劃下的子任務(wù)。(14)支持對納管節(jié)點和集群啟動和禁用。啟用節(jié)點/集群后,該節(jié)點/集群的資源作為當(dāng)前系統(tǒng)分配的資源,禁用節(jié)點/集群后,該節(jié)點/集群僅監(jiān)控不做資源分配,系統(tǒng)可分配值減少禁用節(jié)點/集群的資源量。二、資源分配管理模塊:(1)支持分配計算集群/存儲集群的資源,分配對象類型包括團(tuán)隊、成員或者共享,可批量選擇分配對象進(jìn)行統(tǒng)一分配。(2)新增分配時可查看分配對象的資源使用情況,包括資源額度以及資源使用情況;可查看當(dāng)前操作的團(tuán)隊剩余的可分配額度以及本次分配后分配對象的實際資源額度情況。(3)支持資源分配的超分模式,允許管理員分配的資源總量超過實際物理資源的總量,管理員可自定義超分比例。(4)支持查看資源分配情況,可查看子團(tuán)隊的資源額度以及子團(tuán)隊的資源分配情況,可查看成員的資源額度以及創(chuàng)建容器占用的資源情況。(5)支持修改已有資源分配的用戶的資源額度,分配對象為子團(tuán)隊時,修改分配的最小值為子團(tuán)隊已分配下去的資源量,分配對象為成員時,修改分配的最小值為成員已創(chuàng)建容器占用的資源;修改分配的最大值為當(dāng)前團(tuán)隊空閑資源加當(dāng)前團(tuán)隊已拿到的資源額度。(6)支持團(tuán)隊成員提交個人資源申請到團(tuán)隊管理員;支持團(tuán)隊管理員提交團(tuán)隊資源申請到上一層管理員。(7)支持查看申請記錄詳情,包括申請進(jìn)度、申請的資源配置和實際分配的資源量。(8)支持團(tuán)隊管理員/資源管理員查看已接收到的成員/子團(tuán)隊的資源申請記錄。(9)支持審批申請,可查看申請對象已拿到的資源額度以及資源使用情況,同時展示當(dāng)前團(tuán)隊剩余空閑資源量;審批時審批人可根據(jù)實際情況調(diào)整資源量,實際分配資源值以審批提交為準(zhǔn),審批通過后拿到的實際分配值將與申請對象原已獲取的資源量進(jìn)行疊加。三、容器管理模塊:(1)可選擇已啟用的系統(tǒng)應(yīng)用模板以及團(tuán)隊共享模板,查看容器推薦值;容器的分配類型包括無GPU模式、單GPU模式以及多GPU模式;可靈活配置容器的資源上限值,包括顯存、內(nèi)存和CPU的限制。(2)支持查看容器所在節(jié)點、容器類型以及查看容器實時使用資源量、占用的資源上限值以及容器狀態(tài)。(3)支持資源管理員/團(tuán)隊管理員查看本層級及所有下級的容器情況,包括創(chuàng)建中、運行中、已銷毀、已離線的容器。(4)支持對運行中的容器直接銷毀和重啟。(5)支持對運行中的容器進(jìn)行資源量的調(diào)整,可調(diào)整容器的顯存、內(nèi)存和CPU的限制。(6)支持WEBSSH、JYPUTER、WEBIDE、SSH遠(yuǎn)程鏈接等方式訪問容器實例。(7)支持將容器固化為鏡像存儲到存儲集群中,團(tuán)隊管理員可保存為團(tuán)隊鏡像,團(tuán)隊成員可保存為個人鏡像。(8)支持指定容器將容器內(nèi)已啟動的服務(wù)端口映射到容器外訪問。(9)支持管理員查看近三天無使用記錄且CPU、GPU實際使用量為0的空閑容器。(10)支持創(chuàng)建獨享模式的容器;獨享模式的容器僅系統(tǒng)管理員和創(chuàng)建人可訪問,創(chuàng)建獨享模式的容器時自動掛載當(dāng)前賬號在本團(tuán)隊的個人目錄和共享目錄,獨享模式的容器對個人目錄可讀可寫,對共享目錄為只讀不寫。(11)支持創(chuàng)建共享模式的容器;共享模式的容器為當(dāng)前團(tuán)隊均可使用;共享模式的容器時自動掛載本團(tuán)隊的共享目錄,對共享目錄為可讀可寫。(12)支持資源管理員/團(tuán)隊管理員下發(fā)定時容器到管理的團(tuán)隊及所有下級團(tuán)隊的團(tuán)隊成員,下發(fā)任務(wù)容器時可選擇使用人的團(tuán)隊鏡像、個人鏡像,下發(fā)任務(wù)容器時可選擇容器可訪問時間,訪問時間結(jié)束后容器自動回收。(13)支持下發(fā)任務(wù)容器的團(tuán)隊管理員查看任務(wù)容器信息及最近資源使用情況,隨時回收已下發(fā)的任務(wù)容器,回收時銷毀容器并將資源回到團(tuán)隊空閑資源。(14)支持任務(wù)容器的延時申請,可修改實際延時時間。(15)支持資源管理員/團(tuán)隊管理員下發(fā)課程資源到管理的團(tuán)隊及所有下級團(tuán)隊的團(tuán)隊成員,可指定授課對象以及上課時間,創(chuàng)建課程批量為課程授課對象批量下發(fā)課程容器資源額度,在課程進(jìn)行時可使用課程容器額度創(chuàng)建課程容器。(16)支持對進(jìn)行中的課程進(jìn)行創(chuàng)建容器,在課程結(jié)束時自動銷毀課程容器,支持針對運行中的任務(wù)容器設(shè)置期望回收時間,提交延時申請。四、文件管理模塊:(1)文件管理分為個人目錄和共享目錄。(2)個人目錄為團(tuán)隊成員管理并僅本賬號在該團(tuán)隊下可見;共享目錄為團(tuán)隊管理員管理,團(tuán)隊成員均可見。(3)文件上傳支持?jǐn)帱c續(xù)傳,可查看上傳進(jìn)度。(4)個人目錄的文件上傳限制在當(dāng)前賬號在本團(tuán)隊內(nèi)分配到的文件存儲的大小,超過不可繼續(xù)上傳。(5)共享目錄的文件上傳限制在當(dāng)本團(tuán)隊分配的共享類型的文件存儲的大小,超過不可繼續(xù)上傳。(6)支持下載文件,可暫停/繼續(xù)/取消下載;下載過程中可查看下載進(jìn)度。(7)支持查看下載記錄,支持刪除文件,刪除后已掛載該目錄的容器同步對該文件不可用。五、鏡像管理模塊:(1)資源管理員可上傳鏡像TAR包作為系統(tǒng)鏡像;其他角色用戶可通過容器保存為鏡像。(2)可查看當(dāng)前賬號在本團(tuán)隊內(nèi)可管理的鏡像,資源管理員可管理系統(tǒng)鏡像,團(tuán)隊管理員可管理團(tuán)隊鏡像和個人鏡像;團(tuán)隊成員僅可管理個人鏡像。(3)可啟用/禁用鏡像,啟用鏡像時創(chuàng)建容器可用,禁用時創(chuàng)建容器不可用,禁用狀態(tài)的鏡像不影響已引用的運行中的容器。(4)可查看鏡像信息及引用當(dāng)前鏡像的運行中的容器記錄。(5)可編輯鏡像信息,包括鏡像標(biāo)簽和鏡像描述等。(6)可查看當(dāng)前賬號可用的系統(tǒng)鏡像和團(tuán)隊鏡像。六、數(shù)據(jù)集管理模塊:(1)支持創(chuàng)建已標(biāo)注圖片數(shù)據(jù)集和文本數(shù)據(jù)集。圖片數(shù)據(jù)集支持圖片單分類、物體檢測、語義分割、實例分割場景。圖片數(shù)據(jù)標(biāo)注格式支持PASCALVOC、COCO、文件夾分類等格式。(2)數(shù)據(jù)上傳支持未標(biāo)注和已標(biāo)注兩種類型數(shù)據(jù),上傳數(shù)據(jù)源支持本地上傳,文件格式支持CSV,TXT,JPG,PNG文件,圖像格式包括DCM、NII等。(3)支持項目數(shù)據(jù)集列表展示、公共數(shù)據(jù)集列表展示,支持對數(shù)據(jù)集進(jìn)行增刪改查等操作。(4)支持對數(shù)據(jù)進(jìn)行打標(biāo)簽、將數(shù)據(jù)劃分到各個項目中進(jìn)行管理。(5)支持用戶對一個圖像數(shù)據(jù)進(jìn)行多層標(biāo)注,不同層的標(biāo)注信息可單獨進(jìn)行導(dǎo)出。(6)提供將同一項目的圖像識別結(jié)果批量導(dǎo)出功能,導(dǎo)出結(jié)果應(yīng)包括識別物體、可信度、識別物體位置等信息。(7)提供圖像自動分割功能,在選擇好需要分割的圖像后,對系統(tǒng)中的圖像進(jìn)行分割功能,提供分割結(jié)果預(yù)覽功能,并支持對分割結(jié)果進(jìn)行調(diào)整和審核。七、大模型訓(xùn)練推理模塊:(1)支持將容器訓(xùn)練好的模型進(jìn)行納管以及對外提供推理服務(wù)。(2)提供外部商業(yè)模型(如DeepSeek、Qwen等大模型)的接入。(3)支持在本地部署開源DeepSeek671B和Qwen等大模型。(4)支持基于本地/外部大模型進(jìn)行智能體的開發(fā)。(5)支持根據(jù)用戶權(quán)限對智能體的功能進(jìn)行權(quán)限控制,不同角色使用不同的智能體,同時根據(jù)用戶權(quán)限對智能體能夠使用的本地知識庫進(jìn)行權(quán)限控制,實現(xiàn)數(shù)據(jù)隔離,確保用戶只能訪問授權(quán)數(shù)據(jù)。(6)支持基于大模型的基礎(chǔ)推理能力進(jìn)行應(yīng)用開發(fā),并提供對外服務(wù)。(7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 茶樓棋牌活動策劃方案(3篇)
- 比亞迪出行活動方案策劃(3篇)
- 社團(tuán)頒獎活動策劃方案(3篇)
- 山東省泰安市部分學(xué)校2025-2026學(xué)年高三上學(xué)期1月檢測語文試卷(含答案)
- 醫(yī)聯(lián)體協(xié)同績效管理
- 醫(yī)美醫(yī)療機構(gòu)命名:法律規(guī)范與避坑
- 醫(yī)療項目成本核算與定價實踐
- 醫(yī)療設(shè)備采購國際標(biāo)準(zhǔn)對比分析
- 醫(yī)療設(shè)備采購中的供應(yīng)鏈金融
- 《跨文化商務(wù)交流案例分析(第三版)》全套教學(xué)課件
- 生產(chǎn)設(shè)備維護(hù)保養(yǎng)規(guī)范作業(yè)指導(dǎo)書
- 經(jīng)導(dǎo)管主動脈瓣置換術(shù)(TAVR)患者的麻醉管理
- 2023年興業(yè)銀行貴陽分行招聘人員筆試上岸歷年典型考題與考點剖析附帶答案詳解
- DZ∕T 0214-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 銅、鉛、鋅、銀、鎳、鉬(正式版)
- 加油站百日攻堅行動實施方案
- 馬工程版《中國經(jīng)濟史》各章思考題答題要點及詳解
- 運輸合同糾紛答辯狀
- GB/T 36964-2018軟件工程軟件開發(fā)成本度量規(guī)范
- GB/T 27548-2011移動式升降工作平臺安全規(guī)則、檢查、維護(hù)和操作
- 1、汽車配線、電子連接器及保護(hù)裝置
- 小學(xué)五年級那一刻我長大了600字
評論
0/150
提交評論