版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能與物理計(jì)算綜合平臺(tái)項(xiàng)目需求一、需實(shí)現(xiàn)的功能或者目標(biāo);功能:(1)滿足人工智能、大數(shù)據(jù)、動(dòng)漫與視頻制作、計(jì)算物理、光學(xué)、材料科學(xué)等教學(xué)與科研需求,同時(shí)融合現(xiàn)有設(shè)備系統(tǒng),支撐大語言模型訓(xùn)練及物理學(xué)科大模型算力需求;(2)打造“高共享、高利用率、高效率”的多學(xué)科交叉平臺(tái),促進(jìn)學(xué)校教學(xué)改革與科研成果轉(zhuǎn)化,培養(yǎng)學(xué)生創(chuàng)新實(shí)踐能力,服務(wù)區(qū)域產(chǎn)業(yè)發(fā)展;(3)推動(dòng)與企業(yè)、科研機(jī)構(gòu)合作,提升學(xué)校區(qū)域影響力與社會(huì)服務(wù)能力;二、需執(zhí)行的國(guó)家相關(guān)標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)或者其他標(biāo)準(zhǔn)、規(guī)范;采購(gòu)標(biāo)的需符合相關(guān)行業(yè)的相關(guān)要求;1)本次采購(gòu)的設(shè)備應(yīng)符合本章第三項(xiàng)中所要求的參數(shù)及性能要求;同等條件下,性能高者優(yōu)先采購(gòu);2)本次采購(gòu)的設(shè)備必須是成熟的、合格的產(chǎn)品,能滿足人工智能、計(jì)算物理等領(lǐng)域教學(xué)科研對(duì)算力、顯存、并行計(jì)算等關(guān)鍵指標(biāo)的需求;三、需滿足的質(zhì)量、安全、技術(shù)規(guī)格、物理特性等要求;編號(hào)設(shè)備/項(xiàng)目名稱技術(shù)參數(shù)1高性能大模型訓(xùn)練設(shè)備8U機(jī)架式設(shè)備系統(tǒng):1、CPU:≥Intel(R)Xeon(R)Platinum8558*2;2、內(nèi)存:≥64GBDDR5-4800*32;3、硬盤:≥3.84TB/2.5寸/NVME*1;15.36TB/2.5寸/NVME*2;4、電源:≥鈦金3000W雙輸入交流電源*6;5、GPU顯卡:配置8張一體封裝模組GPU顯卡,單卡GPU算力節(jié)點(diǎn):FP32計(jì)算性能≥0.5petaFLOPS;TF32計(jì)算性能≥7.9petaFLOPS;FP16TC計(jì)算性能≥15.8petaFLOPS;FP8TC計(jì)算性能≥31.6petaFLOPS;GPU算力節(jié)點(diǎn)顯存≥1128GB(提供原廠產(chǎn)品白皮書);GPU算力節(jié)點(diǎn)的GPU之間高效互聯(lián),GPU點(diǎn)對(duì)點(diǎn)的實(shí)測(cè)互聯(lián)帶寬數(shù)據(jù)≥780GB/s;單卡內(nèi)存帶寬≥4.8TB/s,TDP≥700W;6、網(wǎng)卡:配置≥1張10Gb雙光口網(wǎng)卡(含2個(gè)10Gb光模塊),配雙口千兆R(shí)J45網(wǎng)卡;7、陣列控制器:配置NVMEVROC模塊,支持NVMERAID0/1/5/10;8、PCIe插槽:滿足但不限于8個(gè)雙寬x16插槽PCIe5.0,4個(gè)單寬x16插槽PCIe5.0,1個(gè)OCP3.0網(wǎng)卡專用插槽和1個(gè)陣列卡專用插槽;9、硬盤槽位:最大支持24個(gè)熱插拔硬盤槽位,支持8個(gè)NVMe硬盤,支持板載M.2接口≥2;10、接口支持:≥5個(gè)USB接口,≥2個(gè)VGA接口,支持后部獨(dú)立的管理端口;11、滿足系統(tǒng)支撐與承載的配套設(shè)備,如主板、機(jī)箱、顯示器、散熱器、鍵盤及鼠標(biāo)等;12、正版的操作系統(tǒng)、GPU驅(qū)動(dòng)和加速庫、遠(yuǎn)程連接和管理工具;13、主流廠商品牌機(jī),不接受拆改配;2管理與應(yīng)用系統(tǒng)一、集群管理功能1.支持容器及鏡像的全生命周期管理,可對(duì)GPU、CPU集群進(jìn)行統(tǒng)一管理和調(diào)度,實(shí)現(xiàn)資源的高效分配;2.具備多數(shù)據(jù)中心管理能力,允許用戶根據(jù)需求選擇特定數(shù)據(jù)中心的資源進(jìn)行使用;3.集成多種深度學(xué)習(xí)框架(如TensorFlow、PyTorch等)及科學(xué)計(jì)算工具鏈(如CUDAToolkit、OpenMPI、GPU版VASP、LAMMPS等),支持用戶進(jìn)行AI模型開發(fā)、訓(xùn)練及高性能科學(xué)計(jì)算(如分子動(dòng)力學(xué)模擬、材料模擬);同時(shí)支持自定義環(huán)境擴(kuò)展,管理員可配置C/C++編譯器、MPI庫、GPU加速科學(xué)軟件等環(huán)境;4.提供多樣化計(jì)費(fèi)模式及完整的計(jì)量計(jì)費(fèi)功能,管理員可對(duì)GPU、CPU、內(nèi)存等資源設(shè)定費(fèi)用標(biāo)準(zhǔn),并根據(jù)用戶實(shí)際使用時(shí)長(zhǎng)進(jìn)行計(jì)費(fèi);5.可實(shí)時(shí)監(jiān)控集群中GPU服務(wù)系統(tǒng)及GPU卡的運(yùn)行狀態(tài)與資源使用情況,包括GPU總數(shù)、使用數(shù)、核心平均利用率、顯存平均利用率等關(guān)鍵指標(biāo);6.支持多臺(tái)服務(wù)系統(tǒng)的GPU卡資源統(tǒng)一納管與分配,可按GPU型號(hào)進(jìn)行分組,當(dāng)用戶指定特定GPU卡時(shí),能從對(duì)應(yīng)資源池調(diào)度資源;7.支持單機(jī)單卡、單機(jī)多卡、多機(jī)多卡等資源分配-模式;提供單GPU卡多任務(wù)共享、GPU切割(vGPU)功能,提升GPU資源利用率;8.支持組織及用戶優(yōu)先級(jí)設(shè)定,管理員可對(duì)用戶配置1-5級(jí)優(yōu)先級(jí),優(yōu)先級(jí)高的用戶可優(yōu)先調(diào)度資源;9.允許用戶按需申請(qǐng)深度學(xué)習(xí)環(huán)境,如科學(xué)計(jì)算環(huán)境,可指定計(jì)算類型(如AI訓(xùn)練、CUDA開發(fā)、分子動(dòng)力學(xué)模擬、材料計(jì)算)、軟件棧(如PyTorch2.0、VASP6.4-GPU、LAMMPS-GPU、CUDA12.x)、網(wǎng)絡(luò)模型、GPU型號(hào)/數(shù)量及CPU等資源,并支持動(dòng)態(tài)調(diào)整環(huán)境配置;10.集成JupyterLab,支持AI相關(guān)數(shù)據(jù)集成至Jupyter環(huán)境,提供一鍵添加代碼和數(shù)據(jù)集功能,支持在線編程及部署;同時(shí)支持通過SSH訪問環(huán)境,可使用PyCharm、VSCode等工具或命令行(如nvcc、mpirun)開發(fā)/調(diào)試CUDAC/C++程序、提交VASP/LAMMPS任務(wù);11.支持通過Web及Shell提交訓(xùn)練任務(wù),用戶可實(shí)時(shí)查看任務(wù)運(yùn)行結(jié)果;12.具備分布式并行訓(xùn)練功能,支持TensorFlow、PyTorch及科學(xué)計(jì)算軟件(如VASP、LAMMPS)的多節(jié)點(diǎn)GPU加速任務(wù),集成Horovod、Ray及MPI庫(OpenMPI/MVAPICH);用戶可動(dòng)態(tài)申請(qǐng)跨節(jié)點(diǎn)GPU資源,系統(tǒng)自動(dòng)配置多機(jī)通信環(huán)境(如RDMA網(wǎng)絡(luò));13.支持科學(xué)計(jì)算任務(wù)的全生命周期管理,用戶可通過Web或Shell提交VASP、LAMMPS等作業(yè),指定GPU卡數(shù)、MPI進(jìn)程數(shù)、線程數(shù)等參數(shù);系統(tǒng)自動(dòng)生成任務(wù)腳本并調(diào)度資源,實(shí)時(shí)監(jiān)控任務(wù)狀態(tài)與GPU/CPU利用率,任務(wù)結(jié)束提供性能分析報(bào)告;二、數(shù)字孿生與桌面管理1.具備算力資源調(diào)度、桌面環(huán)境構(gòu)建及軟硬件設(shè)備維護(hù)能力,可滿足個(gè)人桌面使用需求;2.支持桌面環(huán)境申請(qǐng)功能:管理員可開放桌面模板,用戶登錄后可查看面向其開放的所有模板,提交創(chuàng)建申請(qǐng)時(shí)可指定使用起止時(shí)間、預(yù)使用時(shí)間段及桌面數(shù)量;3.提供實(shí)驗(yàn)室線上開放功能:可指定開放的可用時(shí)間段、開放對(duì)象,支持按日、周、月設(shè)置重復(fù)開放計(jì)劃;可通過指定對(duì)象或生成邀請(qǐng)鏈接確定開放范圍,并支持對(duì)已開放實(shí)驗(yàn)室執(zhí)行暫停、取消開放操作;4.支持管理員自定義桌面申請(qǐng)自動(dòng)審批策略,可配置自動(dòng)審批通過的時(shí)間范圍、可用時(shí)間段及桌面到期回收策略等,減少人工操作;當(dāng)自動(dòng)審批不通過時(shí),可開啟手動(dòng)審批流程;三、資源融合與調(diào)度1.支持工作站授權(quán)管理,實(shí)現(xiàn)異構(gòu)資源的融合調(diào)度及多模態(tài)大模型融合驅(qū)動(dòng);2.構(gòu)建分級(jí)分域的用戶管理體系,提供集群整體運(yùn)維、運(yùn)營(yíng)情況的數(shù)據(jù)看板,優(yōu)化傳統(tǒng)集群管理方式;3.可對(duì)多種不同硬件進(jìn)行融合管理與調(diào)度,支持接入多個(gè)異地計(jì)算中心實(shí)現(xiàn)統(tǒng)一管理調(diào)度,計(jì)算中心可彈性擴(kuò)容,具備不少于100個(gè)算力服務(wù)器節(jié)點(diǎn)并行納管能力;4.具備實(shí)例創(chuàng)建功能:在實(shí)例創(chuàng)建界面可選擇算力型號(hào)、所需算力數(shù)、主機(jī)(含主機(jī)名稱/ID、算力型號(hào)、最高CUDA、CPU/內(nèi)存分配、空閑磁盤、空閑算力、單價(jià)等信息)、數(shù)據(jù)盤、自定義服務(wù)端口,支持無卡模式開機(jī)及鏡像選擇;同時(shí)支持根據(jù)算力型號(hào)、空閑算力卡、主機(jī)選擇實(shí)例,可配置數(shù)據(jù)盤容量及自定義服務(wù)端口;5.支持彈性部署功能:通過系統(tǒng)創(chuàng)建部署界面,可選擇GPU型號(hào)、GPU數(shù)量、內(nèi)存大小范圍、CPU核心數(shù)量范圍等配置;四、開發(fā)與數(shù)據(jù)支持1.提供系列開發(fā)工具,包括JupyterLab、實(shí)例監(jiān)控等,支持通過RemoteSSH技術(shù)使用VSCode、PyCharm等工具遠(yuǎn)程開發(fā),助力用戶最大化利用系統(tǒng)性能;2.支持?jǐn)?shù)據(jù)存儲(chǔ)與管理功能:可通過網(wǎng)絡(luò)存儲(chǔ)、用戶存儲(chǔ)、網(wǎng)盤客戶端管理數(shù)據(jù)集,網(wǎng)盤客戶端可接入主流云盤,支持用戶通過網(wǎng)絡(luò)云盤傳輸數(shù)據(jù)進(jìn)行作業(yè);3.預(yù)裝基礎(chǔ)訓(xùn)練數(shù)據(jù)集及工具:圖像部分需預(yù)裝部分公開數(shù)據(jù)集,如交通、醫(yī)療等數(shù)據(jù)集,但不限于此,以滿足訓(xùn)練需要;光學(xué)模擬部分需提供基準(zhǔn)數(shù)據(jù)生成工具(如Fourier仿真或自編程腳本);五、鏡像與模型支持1.云鏡像倉庫中部署的鏡像數(shù)量不低于30個(gè),涵蓋以下類型:-熱門類:包括但不限于AI繪畫、大語言模型、知識(shí)問答、視頻生成、數(shù)字人、面部替換、語音合成、訓(xùn)練模型、視頻剪輯、問答、圖像轉(zhuǎn)3D、圖像描述、聲音克??;-多模態(tài)類:包括但不限于大語言模型、數(shù)字人、AI繪畫、知識(shí)問答、視頻生成、語音合成、聲音克隆、訓(xùn)練模型、圖像描述;-計(jì)算機(jī)視覺類:包括但不限于圖像轉(zhuǎn)3D;-語音類:包括但不限于語音合成;-自然語言處理類:包括但不限于問答;-科學(xué)計(jì)算類:包括但不限于CUDAC/C++開發(fā)環(huán)境、GPU版VASP、GPU版LAMMPS;-其他類:包括但不限于面部替換、視頻剪輯;2.支持主流大模型及科學(xué)計(jì)算鏡像創(chuàng)建實(shí)例,從開機(jī)到運(yùn)行時(shí)間、訪問實(shí)例響應(yīng)時(shí)間、輸入問題回答響應(yīng)時(shí)間均需滿足高效性;3.提供多種類型及多個(gè)版本的科學(xué)計(jì)算框架,包括但不限于Miniconda、Torch、TensorFlow、Jax、PaddlePaddle、TensorRT、Gromacs、Jittor、GPU版VASP、GPU版LAMMPS等,提供可運(yùn)行的Python環(huán)境及多版本CUDA、CUDAToolkit(支持C/C++GPU編程)、OpenMPI、GCC多版本等即時(shí)可用的容器運(yùn)行時(shí);4.環(huán)境采用Docker+Conda雙層隔離機(jī)制,對(duì)預(yù)裝模型/工具進(jìn)行容器化部署,確保CUDA開發(fā)環(huán)境與科學(xué)計(jì)算軟件(如VASP/LAMMPS)互不干擾、獨(dú)立運(yùn)行;每個(gè)環(huán)境需附帶完整的Dockerfile或environment.yml文件,支持后期擴(kuò)展與復(fù)現(xiàn);5.模型調(diào)用接口標(biāo)準(zhǔn)化,統(tǒng)一通過RESTAPI或PythonSDK接口調(diào)用,科學(xué)計(jì)算任務(wù)支持通過SSH命令行提交(如mpirun執(zhí)行LAMMPS);6.建立JupyterHub多用戶系統(tǒng),支持多用戶同時(shí)使用相關(guān)開發(fā)環(huán)境;擴(kuò)展支持SSH直連訪問,允許使用VSCode/PyCharm開發(fā)CUDAC/C++程序或調(diào)試VASP/LAMMPS任務(wù);六、開發(fā)流程與日志審計(jì)支持1.平臺(tái)需自動(dòng)記錄每一次用戶任務(wù)執(zhí)行日志,包括:用戶身份、調(diào)用鏡像、輸入?yún)?shù)、資源申請(qǐng)情況(GPU、CPU等);執(zhí)行時(shí)間、失敗/中斷信息、警告信息等;所有記錄需保留≥180天,可導(dǎo)出CSV或JSON;2.平臺(tái)需支持訓(xùn)練任務(wù)中途崩潰自動(dòng)保存日志及緩存,可手動(dòng)恢復(fù)斷點(diǎn);3.管理端提供作業(yè)運(yùn)行統(tǒng)計(jì)報(bào)表模塊,支持按用戶/模型/時(shí)間段生成月度報(bào)告(支持圖表);4.建議提供AI助手界面,用戶可通過問答交互快速了解任務(wù)調(diào)度方式、常見鏡像使用方法(如ChatBot接入文檔);七、系統(tǒng)性能要求1.支持不少于500個(gè)并發(fā)用戶登錄,從點(diǎn)擊登錄按鈕到進(jìn)入主界面的平均響應(yīng)時(shí)間不大于3s;2.系統(tǒng)各功能按鈕(如數(shù)據(jù)概覽、云鏡像倉庫、控制臺(tái)、幫助文檔等)的切換響應(yīng)時(shí)間均小于500ms;八、管理與運(yùn)維1.配置≥1Gb獨(dú)立遠(yuǎn)程管理控制端口,具備虛擬KVM功能,可實(shí)現(xiàn)與操作系統(tǒng)無關(guān)的遠(yuǎn)程完全控制服務(wù)器;提供統(tǒng)一管理軟件,支持在同一管理界面進(jìn)行多點(diǎn)管理;2.支持GPU服務(wù)器及節(jié)點(diǎn)的運(yùn)行狀況、資源使用情況監(jiān)控,包括但不限于節(jié)點(diǎn)負(fù)載、資源分配狀態(tài)等;3.支持帶外升級(jí)功能:不依賴操作系統(tǒng),可通過BMC界面帶外升級(jí)BIOS、BMC版本,支持一次升級(jí)多個(gè)部件固件(如網(wǎng)卡、存儲(chǔ)卡等),無需多次操作;4.支持通過外接USBWIFI模塊提供無線熱點(diǎn),允許使用手機(jī)或便攜機(jī)直接登錄服務(wù)器管理平臺(tái),配合移動(dòng)端APP實(shí)現(xiàn)移動(dòng)運(yùn)維和巡檢;3集成與配套含42U機(jī)柜及配套布線、安裝、調(diào)試與集成,以及所需耗材;1.機(jī)柜承重要求:42U機(jī)柜需支持≥800kg靜態(tài)承重,具備前后門可調(diào)結(jié)構(gòu),支持標(biāo)準(zhǔn)19英寸設(shè)備安裝,配置滾輪與剎車;2.布線系統(tǒng):配套光纖與千兆銅纜應(yīng)符合TIA-568標(biāo)準(zhǔn),配備線纜整理槽、標(biāo)簽標(biāo)識(shí)、預(yù)留≥20%擴(kuò)容空間;3.安裝調(diào)試責(zé)任劃分:設(shè)備廠商負(fù)責(zé)完成整體上架、連線、首次上電、系統(tǒng)初始化與GPU驅(qū)動(dòng)配置,需提供詳細(xì)調(diào)試記錄;4.集成商需提供項(xiàng)目計(jì)劃書(含施工進(jìn)度、時(shí)間節(jié)點(diǎn)),并在完工后提交《交付驗(yàn)收?qǐng)?bào)告》《運(yùn)行測(cè)試報(bào)告》《三方簽字文檔》等相關(guān)文件;四、數(shù)量、采購(gòu)項(xiàng)目交付或者實(shí)施的時(shí)間和地點(diǎn);1、交付清單:編號(hào)設(shè)備名稱/支出項(xiàng)目單位數(shù)量1高性能大模型訓(xùn)練設(shè)備臺(tái)12管理與應(yīng)用系統(tǒng)套13集成與配套套1本項(xiàng)目實(shí)施期限為合同簽訂后40天內(nèi);2、基本要求:1)合同生效后40天內(nèi)完成到貨、安裝、調(diào)試、驗(yàn)收完成;2)包裝要求:負(fù)責(zé)設(shè)備分解,按國(guó)際設(shè)備有關(guān)包裝標(biāo)準(zhǔn)及要求進(jìn)行包裝,若在運(yùn)輸過程中因包裝而引起的設(shè)備腐蝕、剝落、碰損等造成的一切損失將由承擔(dān)責(zé)任;3)運(yùn)輸方式:鐵路、公路、船運(yùn)、航空運(yùn)輸均可;3、軟硬件交付1)應(yīng)保證用戶在使用提供的貨物或其任何一部分時(shí)不受第三方提出侵犯專利權(quán)、商標(biāo)權(quán)或設(shè)計(jì)權(quán)的指控;如果有第三方提出侵權(quán)指控,須與第三方交涉并承擔(dān)可能發(fā)生的一切法律責(zé)任和費(fèi)用;2)系統(tǒng)內(nèi)所提供設(shè)備必須是或生產(chǎn)廠家最新改進(jìn)、原裝成熟軟件、硬件產(chǎn)品,沒有設(shè)計(jì)、材料或工藝上的缺陷,并且是全
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 聲波傳播調(diào)控
- 2026年網(wǎng)絡(luò)安全審計(jì)漏洞修復(fù)合規(guī)評(píng)估練習(xí)題
- 2026年編程邏輯與設(shè)計(jì)習(xí)題集計(jì)算機(jī)基礎(chǔ)訓(xùn)練題目
- 2026年金融投資理論與實(shí)務(wù)考試題集
- 2026年醫(yī)學(xué)考研生物化學(xué)專項(xiàng)練習(xí)題
- 2026年職場(chǎng)法律常識(shí)與案例分析模擬題
- 2026年語言學(xué)專業(yè)知識(shí)基礎(chǔ)與應(yīng)用型英語教學(xué)考點(diǎn)手冊(cè)
- 2026年工程力學(xué)工程結(jié)構(gòu)設(shè)計(jì)分析題庫
- 2026年通訊工程高級(jí)職稱評(píng)審考試全解
- 2026年網(wǎng)絡(luò)教育與信息技術(shù)能力水平測(cè)試題
- 維權(quán)中心工作流程
- 星光精細(xì)化工(張家港)有限公司造紙
- DZ∕T 0219-2006 滑坡防治工程設(shè)計(jì)與施工技術(shù)規(guī)范(正式版)
- 《配電網(wǎng)設(shè)施可靠性評(píng)價(jià)指標(biāo)導(dǎo)則》
- 街道(鄉(xiāng)鎮(zhèn))區(qū)域養(yǎng)老服務(wù)中心建設(shè)驗(yàn)收指標(biāo)總分表及驗(yàn)收標(biāo)準(zhǔn)
- 國(guó)家衛(wèi)生部《綜合醫(yī)院分級(jí)管理標(biāo)準(zhǔn)》
- 預(yù)防兩癌知識(shí)講座
- 人教版九年級(jí)數(shù)學(xué)第二十四章《圓》單元知識(shí)點(diǎn)總結(jié)
- 西班牙語專業(yè)本科論文模板
- GB/T 42288-2022電化學(xué)儲(chǔ)能電站安全規(guī)程
- 地質(zhì)災(zāi)害治理工程用表格(完整資料)
評(píng)論
0/150
提交評(píng)論