版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
T/CESAXXXX—202X
液冷式人工智能加速卡設(shè)計(jì)技術(shù)要求
1范圍
本文件規(guī)定了采用冷板式液冷散熱的標(biāo)準(zhǔn)PCIe接口形態(tài)的人工智能加速卡設(shè)計(jì)要求和技術(shù)要求,并
描述了相關(guān)技術(shù)要求的試驗(yàn)方法。
本文件適用于采用冷板式液冷散熱的標(biāo)準(zhǔn)PCIe接口形態(tài)的人工智能加速卡/服務(wù)器的設(shè)計(jì)、制造和
測(cè)評(píng),其它結(jié)構(gòu)形態(tài)的插卡式人工智能加速卡的冷板式液冷散熱設(shè)計(jì)也可參考。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T17625.9—2016電磁兼容限值低壓電氣設(shè)施上的信號(hào)傳輸發(fā)射電平、頻段和電磁騷擾電
平
YD/T3982—2021數(shù)據(jù)中心液冷系統(tǒng)冷卻液體技術(shù)要求和測(cè)試方法
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
冷板式液冷coldplateliquidcooling
通過冷板(通常為銅鋁等導(dǎo)熱金屬構(gòu)成的封閉腔體)將發(fā)熱器件的熱量間接傳遞給封閉在循環(huán)管路
中的冷卻液體,通過冷卻液體將熱量帶走的一種實(shí)現(xiàn)形式。
3.2
液冷式人工智能加速卡coldplateliquidcoolingartificialintelligenceacceleratorcard
專為人工智能應(yīng)用設(shè)計(jì),通過冷板式液冷進(jìn)行散熱的硬件加速器,可用于提升機(jī)器學(xué)習(xí)和深度學(xué)習(xí)
的速度和性能,從而更好地滿足人工智能應(yīng)用的需求。
3.3
液冷式人工智能服務(wù)器coldplateliquidcoolingartificialintelligenceserver
配備了液冷式人工智能加速卡的服務(wù)器,可為人工智能應(yīng)用提供高效能計(jì)算處理能力。
3.4
機(jī)柜冷卻工質(zhì)供回歧管rackcoolantmanifold
用于向機(jī)柜內(nèi)各液冷冷板分配和回收冷卻工質(zhì)的裝置。
3.5
流體快插接頭fluidquickdisconnect
一種包含插頭和插座、且插頭和插座都帶流體截?cái)喙δ艿目焖俨灏谓M件。
4縮略語
下列縮略語適用于本文件。
AI人工智能(ArtificialIntelligence)
1
T/CESAXXXX—202X
BMC基板管理控制器(BaseboardManagementController)
CEM板卡機(jī)電(CardElectromechanical)
EMC電磁兼容性(ElectromagneticCompatibility)
IT信息技術(shù)(InformationTechnology)
PCIe高速外圍組件互連總線(PeripheralComponentInterconnectExpress)
RCM機(jī)柜冷卻工質(zhì)供回歧管(RackCoolantManifold)
5設(shè)計(jì)要求
5.1冷板設(shè)計(jì)要求
人工智能加速卡的冷板設(shè)計(jì)的一般要求如下:
a)應(yīng)根據(jù)AI芯片的型號(hào)尺寸和發(fā)熱特點(diǎn)及電子信息設(shè)備的內(nèi)部結(jié)構(gòu)進(jìn)行設(shè)計(jì),以獲得更好的換
熱效率,在滿足芯片整個(gè)使用周期內(nèi)的殼溫要求下,盡可能優(yōu)化流道設(shè)計(jì),減小冷板模塊的
流阻;
b)應(yīng)保障滿足AI加速卡插座的載荷及其他結(jié)構(gòu)性要求;
c)應(yīng)考慮配管位置及方向,液體進(jìn)出口位置,避免與電子信息設(shè)備產(chǎn)生干涉;
d)應(yīng)考慮配管的折彎半徑和承壓要求。配管折彎半徑同配管的材質(zhì)和管徑相關(guān),需根據(jù)配管的
材質(zhì)和管徑確定合適的折彎半徑。配管承壓應(yīng)不低于加速卡冷板的承壓;
e)冷板基板和流道宜采用銅或鋁合金材質(zhì),一個(gè)系統(tǒng)中冷卻工質(zhì)直接接觸的部件不應(yīng)有兩種電
極電位差較大的金屬;
f)冷卻工質(zhì)的選用應(yīng)考慮與二次側(cè)循環(huán)回路中所有直接接觸的固體表面材質(zhì)間的相容性;
g)應(yīng)符合芯片對(duì)散熱器重量的要求;
h)應(yīng)考慮冷板的安裝及拆卸順序,滿足芯片的操作規(guī)范;
i)應(yīng)滿足芯片的扣合力技術(shù)要求,安裝拆除后散熱基板底面滿足平面度技術(shù)要求;
j)冷板的材料需要考慮導(dǎo)熱性及與冷卻液的化學(xué)兼容性,例如可選擇紫銅;
k)加速卡內(nèi)冷板結(jié)構(gòu)宜使用焊接工藝,避免加速卡內(nèi)部的漏液。
5.2漏液檢測(cè)裝置設(shè)計(jì)要求
采用冷板式散熱的人工智能加速卡上宜有漏液檢測(cè)裝置。若人工智能加速卡支持漏液檢測(cè)裝置,需
滿足如下設(shè)計(jì)要求:
a)漏液檢測(cè)裝置需具備漏液檢測(cè)和報(bào)警功能,應(yīng)在管路接口等高風(fēng)險(xiǎn)位置布置檢測(cè)點(diǎn),如發(fā)生
漏液支持上報(bào)漏液告警給服務(wù)器BMC;
b)漏液檢測(cè)裝置應(yīng)緊貼管路或冷板表面,每隔適當(dāng)距離進(jìn)行固定,避免懸空脫落;
c)漏液檢測(cè)裝置最小漏液檢測(cè)量應(yīng)不大于0.3ml;
a)漏液檢測(cè)裝置需具有易恢復(fù)性,在漏液處理完畢后,可通過簡(jiǎn)易手段解除報(bào)警狀態(tài);
b)漏液檢測(cè)裝置通訊端到檢測(cè)端長(zhǎng)度應(yīng)適配設(shè)計(jì),避免過度冗余;
c)漏液檢測(cè)裝置推薦使用高阻燃規(guī)格;
d)漏液檢測(cè)裝置在高溫高濕且接觸金屬的情況下應(yīng)具備防誤報(bào)功能。
5.3多卡互連設(shè)計(jì)要求
流體快插接頭位于人工智能加速卡擋片端時(shí)水路參考設(shè)計(jì)如圖1,此設(shè)計(jì)下加速卡流體快插接頭直
接伸出服務(wù)器面板外,水管安裝在服務(wù)器外部,降低漏液風(fēng)險(xiǎn)。但由于機(jī)箱外水管較多,會(huì)對(duì)服務(wù)器面
板對(duì)外IO接口造成遮擋。加速卡之間水路可以串聯(lián),加速卡水路串聯(lián)時(shí),需要考慮串聯(lián)總功耗、溫升、
流速、冷板和流體快插接頭壓降,來確認(rèn)最大可串聯(lián)加速卡卡數(shù)。
2
T/CESAXXXX—202X
液冷加速卡1液冷加速卡1
液冷加速卡2液冷加速卡2
水管
液冷加速卡3液冷加速卡3
集分水器
集分水器
液冷加速卡4液冷加速卡4
水管水管
服務(wù)器內(nèi)部水管
服務(wù)器內(nèi)部液冷加速卡5液冷加速卡5
液冷加速卡6液冷加速卡6
液冷加速卡7液冷加速卡7
液冷加速卡
液冷加速卡88
服務(wù)器后窗服務(wù)器后窗
注:左圖為加速卡之間無串聯(lián),右圖為2張加速卡串聯(lián)
圖1快插接頭位于加速卡擋片端水路設(shè)計(jì)
流體快插接頭位于人工智能加速卡尾端時(shí)水路參考設(shè)計(jì)如圖2,此設(shè)計(jì)下服務(wù)器內(nèi)部水管較多,需
要在水管上布置漏液檢測(cè)線或其它漏液檢測(cè)裝置,以監(jiān)測(cè)漏液。加速卡液體統(tǒng)一匯集到服務(wù)器內(nèi)部的集
分水器后,再由集分水器出水管統(tǒng)一輸出到機(jī)箱外。機(jī)箱外水管較少,外觀更整潔,對(duì)外插卡的對(duì)外接
口遮擋少。同樣的,加速卡之間水路可以串聯(lián),加速卡水路串聯(lián)時(shí),需要考慮串聯(lián)總功耗、溫升、流速、
冷板和流體快插接頭壓降,來確認(rèn)最大可串聯(lián)加速卡卡數(shù)。
液冷加速卡1
液冷加速卡1
液冷加速卡
2液冷加速卡2
液冷加速卡
3液冷加速卡3
集分水器
液冷加速卡集分水器
4水管液冷加速卡4水管
服務(wù)器內(nèi)部服務(wù)器內(nèi)部
液冷加速卡5液冷加速卡5
液冷加速卡6液冷加速卡6
液冷加速卡7液冷加速卡7
水管水管
服務(wù)器后窗服務(wù)器后窗
液冷加速卡8液冷加速卡8
注:左圖為加速卡之間無串聯(lián),右圖為2張加速卡串聯(lián)
圖2快插接頭位于加速卡尾端水路設(shè)計(jì)
6技術(shù)要求
6.1外觀要求
人工智能加速卡外觀要求如下:
a)冷板散熱蓋板應(yīng)光滑,無明顯變形,散熱基板底部表面不應(yīng)有裂紋,劃痕,變形、污點(diǎn)等缺
陷;
b)冷板散熱基板散熱面形狀宜為方形或八邊形;
c)固定模塊表面銳邊倒鈍,無毛刺,外表面無劃痕、臟污,明顯色差和花斑、裂縫、變形等缺
陷,涂覆層無起泡、堆積、龜裂和脫落現(xiàn)象;
d)接口應(yīng)無毛刺、劃痕、變形等缺陷,并與配管順暢接合;
e)配管管內(nèi)應(yīng)無臟污,無毛邊披鋒,無破損;
f)快插接頭標(biāo)記應(yīng)正確、清晰、牢固、耐久,應(yīng)包括公司商標(biāo)、產(chǎn)品型號(hào)和生產(chǎn)批次號(hào),表面
不應(yīng)有機(jī)械損傷、毛刺、銳邊、沙眼、起皮等缺陷。
6.2結(jié)構(gòu)要求
6.2.1尺寸要求
3
T/CESAXXXX—202X
液冷式人工智能加速卡冷板宜全覆蓋加速卡進(jìn)行全水冷設(shè)計(jì),擋片宜不開孔。加速卡對(duì)外液冷接口
需要考慮和服務(wù)器系統(tǒng)或RCM的對(duì)接方式,有利于加速卡和外界液冷系統(tǒng)對(duì)接。板卡尺寸符合PCIe
CEM規(guī)范,為單槽或者雙槽、全高形態(tài),卡長(zhǎng)L0(不含快插接頭)宜小于等于266.7mm。加速卡的流
體快插接頭可根據(jù)應(yīng)用場(chǎng)景放置于加速卡擋片端或者加速卡尾端。
當(dāng)流體快插接頭位于擋片側(cè),結(jié)構(gòu)尺寸設(shè)計(jì)要求如下圖3所示:
注:流體快插接頭位于擋片端。
圖3結(jié)構(gòu)設(shè)計(jì)要求
6.2.1.1液冷式人工智能加速卡需要插入服務(wù)器才能工作,因服務(wù)器后窗針對(duì)液冷卡有限制,需要滿
足下列要求:
a)如圖1所示,加速卡流體快插接頭位于擋片側(cè),進(jìn)水口位于出水口上方??觳褰宇^和冷板連
接的地方,需要做凸臺(tái),凸臺(tái)高度與機(jī)箱后窗結(jié)構(gòu)相關(guān),宜高度不小于3mm,以方便密封和
在服務(wù)器側(cè)的插拔;
b)進(jìn)水口快插接頭中心點(diǎn)距離擋片最上方距離A大于等于50mm,以避免加速卡插入后擋片和
板卡結(jié)構(gòu)干涉,確保加速卡快插接頭可以從服務(wù)器后窗推出;
c)快插接頭的左邊緣距離擋片右邊緣B應(yīng)小于等于15.23mm;
d)快插接頭的外徑C需要小于機(jī)箱后窗開口的寬度,最大不超過12mm;
e)快插接頭公頭位于加速卡上,兩個(gè)快插接頭公頭中心點(diǎn)之間距離D大于等于24mm,以滿足
快插接頭母頭能支持正常的插拔操作,且無結(jié)構(gòu)干涉;
f)加速卡快插接頭母頭最大直徑19.5mm,宜小于18mm,以滿足兩張相鄰的加速卡之間快插接
頭正常的插拔操作。
6.2.1.2當(dāng)流體快插接頭位于尾端時(shí),設(shè)計(jì)要求如圖4所示。需要滿足下列要求:
4
T/CESAXXXX—202X
注:流體快插接頭位于加速卡尾端。
圖4結(jié)構(gòu)設(shè)計(jì)要求
a)如圖2所示,加速卡流體快插接頭位于尾端,進(jìn)水口位于出水口上方。為了節(jié)省空間,快插
接頭和冷板連接的地方不宜有凸臺(tái);
b)加速卡公頭位于加速卡上,兩個(gè)快插接頭公頭中心點(diǎn)之間距離A大于等于24mm,以滿足快
插接頭母頭能支持正常的插拔操作,且無結(jié)構(gòu)干涉;
c)出水口快插接頭中心點(diǎn)距離加速卡金手指下邊緣B大于等于38.78mm;
d)加速卡快插接頭母頭最大直徑19.5mm,宜小于18mm,以滿足兩張相鄰的加速卡之間快插接
頭正常的插拔操作;
e)為了便于服務(wù)器機(jī)箱設(shè)計(jì),流體快插接頭位于尾端時(shí),宜加速卡本體+快插接頭靜態(tài)插合尺寸
L1不超過312m。
6.2.2冷板結(jié)構(gòu)要求
加速卡冷板的結(jié)構(gòu)設(shè)計(jì)要求如下:
a)宜冷板對(duì)板卡上的熱源全覆蓋;
b)固定方式宜使用4個(gè)彈簧螺絲固定的方式進(jìn)行固定;
c)主芯片和冷板之間的壓力應(yīng)保證貼合良好,并具有足夠的熱傳導(dǎo)性;
d)冷板散熱基板底部和主芯片接觸區(qū)域要求光滑,且平面度小于或等于0.05mm,粗糙度Ra1.6;
e)冷板內(nèi)腔清潔度要求:冷板沖洗后液體中固態(tài)顆粒物含量,<0.5μm顆粒不超過25顆/ml,
0.5~1μm顆粒不超過5顆/ml,1μm~3μm顆粒不超過3顆/ml。直徑超過50um的金屬
顆粒不超過1顆/100ml,沒有直徑超過100μm金屬顆粒。
6.2.3流體快插接頭要求
人工智能加速卡流體快插接頭主要考慮結(jié)構(gòu)兼容性,需要保證在加速板卡側(cè)面正常連接冷板,同時(shí)
組裝在服務(wù)器上不發(fā)生結(jié)構(gòu)干涉。流體快插接頭的安裝面應(yīng)有足夠的厚度,以滿足安裝要求,具體要求
以流體快插接頭規(guī)格書為準(zhǔn)。為了滿足快插接頭位于人工智能加速卡擋片端或者尾端兩種不同場(chǎng)景下的
結(jié)構(gòu)要求,流體快插接頭尺寸要求見表1。
5
T/CESAXXXX—202X
表1流體快插接頭規(guī)格要求
流體快插接頭參數(shù)規(guī)格要求
公頭最大直徑≤12mm
母頭最大直徑≤19.5mm,推薦不大于18mm
靜態(tài)插合尺寸≤45mm
靜態(tài)插合尺寸是指快插接頭公頭和母頭插合后,公頭橡膠圈端面和母頭橡膠圈端面之間的尺寸,如
圖5所示。宜避免使用latch解鎖的快接頭,以避免多個(gè)加速卡疊放時(shí),快接頭旋轉(zhuǎn)過程中導(dǎo)致快接頭自
動(dòng)解鎖。
靜態(tài)插合尺寸
圖5流體快插接頭靜態(tài)插合尺寸示意圖
流體快插接頭應(yīng)采用平頭無滴漏結(jié)構(gòu),來確保插拔時(shí)不會(huì)形成液滴損壞周邊電子元件;流體快插接
頭的表面可有少量液體殘留,但流體泄漏量不高于0.005ml,以確保插拔的安全性。
6.3熱性能要求
6.3.1熱性能參數(shù)要求
冷板式人工智能加速卡熱性能參數(shù)要求值見表2。
表2熱性能參數(shù)要求
熱性能參數(shù)參數(shù)要求
加速卡熱設(shè)計(jì)功耗≤1000W
加速卡進(jìn)水溫度30℃~55℃(最低溫度為參考值,宜高于機(jī)房凝露溫度3℃)
加速卡最大出水溫度65℃(參考值)
進(jìn)出水口溫升額定入水流量下,加速卡進(jìn)出水口溫升,需滿足如下要求:
加速卡功耗≤600W:溫升宜6℃~10℃
加速卡功耗≤1000W:溫升宜9℃~10℃
加速卡功耗>1000W:溫升根據(jù)用戶機(jī)房實(shí)際條件進(jìn)行確認(rèn)
進(jìn)出水口最大壓降在額定入水流量下,加速卡進(jìn)水口到出水口總壓降(含快插接頭),需滿足如下要求:
加速卡功耗≤600W:最大壓降≤45kPa
加速卡功耗≤1000W:最大壓降≤65kPa
加速卡功耗>1000W:最大壓降根據(jù)用戶機(jī)房實(shí)際條件進(jìn)行確認(rèn)
6
T/CESAXXXX—202X
翅片流速經(jīng)過翅片的最大流速≤2m/s
冷板式人工智能加速卡的規(guī)格書中應(yīng)當(dāng)有熱邊界條件曲線。圖6給出了熱邊界曲線示意,當(dāng)使用邊
界條件(入口流量及入口溫度)位于曲線下方(含曲線)時(shí),該冷板的冷卻能力即能符合待冷卻AI芯
片的最大結(jié)溫要求;
加速卡入口液體溫度
(
℃
)
加速卡入口流量(L/min)
圖6加速卡設(shè)計(jì)的熱邊界條件曲線示意圖
6.3.2材料選型要求
材料選型的要求見表3。
表3材料選型要求
組件材料選型及要求宜
冷卻工質(zhì)需要考慮冷卻工質(zhì)熱物性、環(huán)保特性、安全特性、環(huán)境適應(yīng)性、工質(zhì)與管路材料兼容
性、工質(zhì)成本和可獲取性等。IT設(shè)備推薦使用含緩蝕劑、殺菌劑等藥劑的水、乙二醇
/丙二醇水溶液等。冷卻液標(biāo)準(zhǔn)參考YD/T3982—2021。
冷板冷板材質(zhì)優(yōu)選:紫銅、鋁合金(需做好耐腐蝕和絕緣要求)
快插接頭和冷卻液具有化學(xué)兼容性
不銹鋼、鋁合金(僅限搭配鋁合金冷板)、黃銅(表面需要做好鍍層,把黃銅和液體
隔離,冷卻液不推薦使用去離子水)
6.4環(huán)境適應(yīng)性要求
6.4.1氣候環(huán)境適用性
工作、貯存中溫度、濕度、壓力要求見表4。
表4氣候環(huán)境適用性要求
參數(shù)參考值
溫度工作:5℃~40℃
貯存:-45℃~85℃
濕度工作:8%RH~90%RH(無冷凝)
貯存:10%RH~93%RH(無冷凝)
7
T/CESAXXXX—202X
大氣壓86kPa~106kPa
6.4.2機(jī)械適用性
6.4.2.1冷板承壓要求見表5。
表5冷板承壓要求
參數(shù)參考值
冷板額定工作壓力≤300kPa
冷板最大工作壓力350kPa,無液體泄露,無變形
冷板最小爆破壓力最大工作壓力的3倍,無液體泄露,可變形
6.4.2.2振動(dòng)適應(yīng)性應(yīng)符合表6的規(guī)定。
表6振動(dòng)適用性
振動(dòng)類型頻率范圍初始激勵(lì)加速度振動(dòng)方向和持續(xù)時(shí)間
隨機(jī)振動(dòng)(單卡不帶包裝)5Hz~500Hz不低于2.2grmsX/Y/Z軸,每軸10min
隨機(jī)振動(dòng)(單卡帶包裝)1Hz~200Hz0.82grmsX/Y/Z軸,每軸30min
6.4.2.3沖擊適用性應(yīng)符合表7的規(guī)定,測(cè)試條件為單卡不帶包材。
沖擊試驗(yàn)嚴(yán)酷等級(jí)和沖擊脈沖盡量模擬樣品實(shí)際可能受到的運(yùn)輸或工作環(huán)境情況??蓞⒖家韵聡?yán)酷
性等級(jí),當(dāng)采用多加速度組合測(cè)試時(shí),需覆蓋使用表中50m/s2~105m/s2的各個(gè)加速度值進(jìn)行測(cè)試;當(dāng)采
用單一加速度測(cè)試時(shí),可根據(jù)實(shí)際情況選擇任一加速度值和脈沖持續(xù)時(shí)間進(jìn)行測(cè)試。
表7沖擊適用性
峰值加速度脈沖持續(xù)時(shí)間
測(cè)試類型沖擊波形沖擊方向和次數(shù)
m/s2ms
5026半正弦波4個(gè)方向,每個(gè)方向1次
多加速度組合測(cè)6013半正弦波4個(gè)方向,每個(gè)方向1次
試903.3半正弦波4個(gè)方向,每個(gè)方向1次
1052半正弦波4個(gè)方向,每個(gè)方向1次
1005梯形波/半正弦波6個(gè)方向,每個(gè)方向5次
10011梯形波/半正弦波6個(gè)方向,每個(gè)方向5次
單一加速度測(cè)試
1505梯形波/半正弦波6個(gè)方向,每個(gè)方向5次
15011梯形波/半正弦波6個(gè)方向,每個(gè)方向5次
6.4.2.4運(yùn)輸包裝件跌落適應(yīng)性應(yīng)能在914mm高度進(jìn)行,進(jìn)行一角三棱六面共10次測(cè)試。
6.5電磁兼容性要求。
電磁兼容性要求如下:
a)搭配服務(wù)器去獲取EMCCLASSA認(rèn)證,實(shí)際設(shè)計(jì)參考GB/T17625.9—2016相關(guān)要求;
b)加速卡若設(shè)置漏液檢測(cè)裝置,應(yīng)考慮EMC對(duì)漏液檢測(cè)裝置的影響,在設(shè)計(jì)上避免誤報(bào)警。
7試驗(yàn)方法
8
T/CESAXXXX—202X
7.1試驗(yàn)條件
除另有規(guī)定外,試驗(yàn)均在下列測(cè)試用標(biāo)準(zhǔn)大氣條件下進(jìn)行:
——溫度:15℃~35℃;
——相對(duì)濕度:25%~75%;
——大氣壓:86kPa~106kPa。
7.2外觀檢驗(yàn)
通過目測(cè)法對(duì)人工智能加速卡的外觀進(jìn)行檢查,確定是否符合6.1的外觀要求;
7.3結(jié)構(gòu)試驗(yàn)
7.3.1尺寸檢驗(yàn)
尺寸檢驗(yàn)要求如下:
a)利用游標(biāo)卡尺或相似功能設(shè)備測(cè)量人工智能加速卡板卡的尺寸是否符合要求;
b)利用游標(biāo)卡尺或相似功能設(shè)備測(cè)量人工智能加速卡進(jìn)出水口流體快插接頭的尺寸、相對(duì)間距
是否符合要求。
7.3.2冷板檢驗(yàn)
冷板檢驗(yàn)要求如下:
a)使用三次元測(cè)量?jī)x或相似功能設(shè)備測(cè)量冷板底部表面的平面度是否符合要求;
b)使用粗糙度測(cè)量?jī)x或相似功能設(shè)備測(cè)量冷板底部表面的粗糙度是否符合要求;
c)使用用X射線或類似分析方法檢查冷板,以檢測(cè)冷板換熱器上的制造缺陷,如孔隙、流體通
道碎片、焊接質(zhì)量等;
d)將冷板集成到產(chǎn)品冷板組件中,并完成靜水壓測(cè)試,以確認(rèn)交換器(如有)、快接頭和冷卻
液管道之間沒有泄漏;
e)用清澈的液體沖洗冷板組件,同時(shí)浸入超聲波浴或類似功能的設(shè)備中,并驗(yàn)證排出的流體沒
有變色,并且懸浮在沖洗液中的任何顆粒都滿足本標(biāo)準(zhǔn)6.2.2定義的冷板內(nèi)腔清潔度要求。
7.3.3流體快插接頭檢驗(yàn)
流體快插頭檢驗(yàn)要求如下:
a)檢查冷板快接頭,以確認(rèn)流體快插接頭規(guī)格(即尺寸、倒鉤配置、方向等)符合產(chǎn)品設(shè)計(jì)要
求;
b)利用游標(biāo)卡尺或相似功能設(shè)備測(cè)量流體快插接頭的尺寸是否符合要求;
c)注入冷卻工質(zhì)后,手動(dòng)拔插流體快插接頭,確認(rèn)液體泄漏量是否符合要求。
7.3.4氣密性試驗(yàn)
氣密性試驗(yàn)宜采用氦檢或氣檢,試驗(yàn)方法如下:
a)氦檢試驗(yàn)方法:將冷板式人工智能加速卡充氦氣(充入壓力350kPa),將加速卡放在真空箱內(nèi),
設(shè)備抽真空,保壓1min;或?qū)⒗浒迨饺斯ぶ悄芗铀倏ǔ檎婵?,箱體內(nèi)充氦氣(沖入壓力350kPa),
保壓1min。
合格判據(jù):檢驗(yàn)氦氣泄漏率<10-7Pa·m3/s。
b)氣檢試驗(yàn)方法:采用氣檢,介質(zhì)為氮?dú)?,加壓?00kPa,保持時(shí)間不低于300s.
合格判據(jù):測(cè)試壓降/充入壓力<0.01%。
7.4熱性能試驗(yàn)
7.4.1熱性能測(cè)試要求
9
T/CESAXXXX—202X
熱性能測(cè)試要求如下:
a)測(cè)試工質(zhì)宜使用與實(shí)際使用的工質(zhì)同型號(hào)或可兼容的型號(hào);
b)測(cè)試供液設(shè)備可使用二次側(cè)水路供水,也可采用直接風(fēng)液換熱設(shè)備(水冷機(jī)等)供水,單個(gè)
冷板支路的供水水溫、流量、水壓可根據(jù)實(shí)際測(cè)試要求調(diào)節(jié);
c)測(cè)試供液液路的連接器宜采用相同快接型號(hào),快接具備斷水自鎖及防滴液功能;
d)測(cè)試完成后需有排水及烘干動(dòng)作,確保液路中無測(cè)試造成的工質(zhì)或氣體殘留;
e)冷板廠做冷板出廠熱性能測(cè)試,系統(tǒng)廠做整卡組裝后的熱性能測(cè)試;
f)冷板廠熱源尺寸,加熱功率,熱源布局及位置,測(cè)試時(shí)長(zhǎng),測(cè)試標(biāo)準(zhǔn),平面度,安裝方式及
安裝壓力,界面材料類型、厚度及熱性能篩選指標(biāo)需與系統(tǒng)廠或設(shè)計(jì)者確認(rèn);
g)測(cè)試時(shí)發(fā)熱功率、進(jìn)水水溫(有條件宜按最高55℃,也可按當(dāng)前水溫?fù)Q算)、進(jìn)水流量宜按
實(shí)際設(shè)計(jì)最嚴(yán)設(shè)計(jì)指標(biāo)測(cè)試,進(jìn)水水溫和熱源溫度穩(wěn)定后,讀取熱源溫度(冷板廠讀取熱源
溫度,系統(tǒng)廠讀取實(shí)際板卡主芯片、器件等溫度),計(jì)算溫升后篩出不符合溫升標(biāo)準(zhǔn)的冷板
或液冷加速卡。
7.4.2熱性能曲線
將冷板固定在待測(cè)加速卡AI芯片上,冷板的液體進(jìn)出口與熱性能測(cè)試系統(tǒng)相連,確保測(cè)試環(huán)路中
非凝性氣體排空,并將流經(jīng)冷板的液體流量調(diào)節(jié)到期望值,給待測(cè)AI芯片施加期望的功耗,待測(cè)試結(jié)
果穩(wěn)定后,記錄冷板進(jìn)出口的壓力值P1,P2,待測(cè)AI芯片的結(jié)溫Tj,冷板入口液體溫度Ti,給待測(cè)AI芯片
施加的功耗值Q以及流經(jīng)冷板的液體流量值。
根據(jù)測(cè)試結(jié)果,分別根據(jù)式(1)和式(2)計(jì)算冷板在一定的流量范圍內(nèi)的熱阻值和流阻值,繪出
液冷式人工智能加速卡的熱性能曲線流阻曲線(見圖7)
Rji=(Tj-Ti)/Q………………(1)
式中:
Rji——AI芯片到冷板的熱阻,單位為攝氏度每瓦(℃/W);
Tj——待冷卻AI芯片的結(jié)溫,單位為攝氏度(℃);
Ti——人工智能加速卡入口液體溫度,單位為攝氏度(℃);
Q——施加在處理器上的功耗值,單位為瓦(W)。
△P=P1-P2……………………(2)
式中:
△P——流經(jīng)人工智能加速卡的流阻值,單位為千帕(kPa);
P1——人工智能加速卡進(jìn)水口的壓力值,單位為千帕(kPa);
P2——人工智能加速卡出水口的壓力值,單位為千帕(kPa)。
在用戶期望的液冷式人工智能加速卡使用邊界條件下(給定的Ti和Q),測(cè)得的冷板所能支持的AI
芯片結(jié)溫值,在考慮標(biāo)準(zhǔn)差和冷板生命周期內(nèi)熱性能衰減之后不高于AI芯片最大結(jié)溫。
10
T/CESAXXXX—202X
加速卡流阻
R
ij(
℃
/
W(
)kPa
)
流經(jīng)加速卡的流量(L/min)
圖7液冷式加速卡熱性能和流阻曲線示意圖
7.5環(huán)境適應(yīng)性試驗(yàn)
7.5.1氣候環(huán)境適應(yīng)性試驗(yàn)
7.5.1.1高低溫循環(huán)
7.5.1.1.1工作條件下的高低溫循環(huán)試驗(yàn)方法如下:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò);
c)將搭配人工智能加速卡(含冷卻工質(zhì))的系統(tǒng)放入高低溫試驗(yàn)箱內(nèi),并連接電源;
d)設(shè)定高低溫試驗(yàn)箱溫度循環(huán):0℃—40℃—0℃;升降溫速率:大于1.5℃一分鐘。無需保壓。
循環(huán)次數(shù):400次;
e)開機(jī)運(yùn)行人工智能加速卡壓力測(cè)試程序,高低溫試驗(yàn)箱運(yùn)行程序;
f)循環(huán)完成后進(jìn)行外觀檢測(cè)、氣密性測(cè)試、漏液線功能測(cè)試、散熱性能、功能測(cè)試。
7.5.1.1.2工作條件下的高低溫循環(huán)試驗(yàn)方法合格判據(jù):
a)氣密性滿足7.3.4要求;
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
d)外觀無異常;
e)人工智能加速卡壓力測(cè)試未發(fā)生異常報(bào)錯(cuò)。
7.5.1.1.3貯存條件下的高低溫循環(huán)試驗(yàn)方法如下:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò);
c)將人工智能加速卡(不含冷卻工質(zhì))放入高低溫試驗(yàn)箱內(nèi);
d)無需保壓??筛鶕?jù)實(shí)際需求選擇表8中場(chǎng)景之一設(shè)定高低溫試驗(yàn)箱溫度循環(huán)參數(shù)進(jìn)行測(cè)試;
表8貯存條件下的高低溫循環(huán)試驗(yàn)場(chǎng)景
場(chǎng)景溫度循環(huán)范圍升降溫速率循環(huán)次數(shù)
高低溫循環(huán)-45℃—85℃大于等于16.5℃一分鐘200
溫度沖擊-45℃—85℃大于等于20℃一分鐘10
e)高低溫試驗(yàn)箱運(yùn)行程序;
f)循環(huán)完成后進(jìn)行外觀檢測(cè)、氣密性測(cè)試、漏液線功能測(cè)試、散熱性能測(cè)試、功能測(cè)試。
11
T/CESAXXXX—202X
7.5.1.1.4貯存條件下的高低溫循環(huán)試驗(yàn)合格判據(jù):
a)氣密性滿足7.3.4要求;
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
d)外觀無異常;
e)測(cè)試完成后,對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,無異常報(bào)錯(cuò)。
7.5.1.2高溫高濕
7.5.1.2.1工作條件下的高溫高濕試驗(yàn)方法:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò);
c)將搭配人工智能加速卡(含冷卻工質(zhì))的系統(tǒng)放入高溫高濕試驗(yàn)箱內(nèi),并連接電源;
d)箱內(nèi)溫度設(shè)置為40℃;相對(duì)濕度保持90%RH;持續(xù)400小時(shí)。測(cè)試過程中運(yùn)行壓力腳本對(duì)
人工智能加速卡進(jìn)行壓力測(cè)試;
e)高溫高濕完成后進(jìn)行外觀檢測(cè)、氣密性測(cè)試、漏液線功能測(cè)試、散熱性能測(cè)試、功能測(cè)試。
7.5.1.2.2工作條件下的高溫高濕試驗(yàn)合格判據(jù):
a)氣密性滿足7.3.4要求;
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
d)外觀無異常;
e)人工智能加速卡壓力測(cè)試未發(fā)生異常報(bào)錯(cuò)。
7.5.1.2.3貯存條件下的高溫高濕試驗(yàn)方法:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò);
c)將人工智能加速卡(不含冷卻工質(zhì))的系統(tǒng)放入高溫高濕試驗(yàn)箱內(nèi);
d)箱內(nèi)溫度設(shè)為為85℃;箱內(nèi)相對(duì)濕度保持93%RH;持續(xù)400小時(shí);
e)高溫高濕完成后進(jìn)行外觀檢測(cè)、氣密性測(cè)試、漏液線功能測(cè)試、散熱性能測(cè)試、功能測(cè)試。
7.5.1.2.4貯存條件下的高溫高濕試驗(yàn)合格判據(jù):
a)氣密性滿足7.3.4要求;
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
d)外觀無異常;
e)測(cè)試完成后,對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,無異常報(bào)錯(cuò)。
7.5.2機(jī)械適用性要求試驗(yàn)
7.5.2.1振動(dòng)試驗(yàn)
7.5.2.1.1單卡振動(dòng)試驗(yàn)方法:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò);
c)對(duì)人工智能加速卡進(jìn)行振動(dòng)試驗(yàn),振動(dòng)臺(tái)設(shè)置為:5Hz@0.001g2/Hz至20Hz@0.01g2/Hz(逐
漸遞升);20Hz至500Hz@0.01g2/Hz(恒定);輸入加速度為2.2gRMS;
d)X軸、Y軸、Z軸,每軸10分鐘。
7.5.2.1.2單卡振動(dòng)試驗(yàn)合格判據(jù):
a)氣密性滿足7.3.4規(guī)定;
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
12
T/CESAXXXX—202X
d)外觀無異常;
e)對(duì)人工智能加速卡進(jìn)行功能驗(yàn)證,無卡死、宕機(jī)等現(xiàn)象、無其它異常報(bào)錯(cuò);
f)拆下冷板,檢查冷板平面度應(yīng)符合6.2.2d)中的要求。
7.5.2.1.3單卡帶包材振動(dòng)試驗(yàn)方法:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò);
c)將人工智能加速卡按照正常出貨的包裝形式進(jìn)行包裝后,放置于振動(dòng)臺(tái);
d)按照表9設(shè)置振動(dòng)臺(tái)參數(shù);
表9單卡帶包材振動(dòng)試驗(yàn)振動(dòng)參數(shù)
頻率(Hz)PSD(g2/Hz)
10.000036
30.06
40.06
80.007
120.016
300.006
400.015
600.0014
1000.001
2000.00005
加速度均方根(grms)0.82
e)X軸、Y軸、Z軸,每軸30分鐘。
7.5.2.1.4單卡帶包材振動(dòng)試驗(yàn)合格判據(jù):
a)氣密性滿足7.3.4規(guī)定;
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
d)外觀無異常;
e)對(duì)人工智能加速卡進(jìn)行功能驗(yàn)證,無卡死、宕機(jī)等現(xiàn)象、無其它異常報(bào)錯(cuò);
f)拆下冷板,檢查冷板平面度應(yīng)符合6.2.2d)中的要求。
7.5.2.2沖擊試驗(yàn)
7.5.2.2.1試驗(yàn)方法:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò);
c)測(cè)試波形:梯形波;
d)加速度:100m/s2;
e)方向:3軸向,6個(gè)方向;
f)測(cè)試時(shí)間:5ms,每方向5次,共30次;
7.5.2.2.2合格判據(jù):
a)氣密性滿足7.3.4規(guī)定;
13
T/CESAXXXX—202X
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
d)外觀無異常;
e)對(duì)人工智能加速卡進(jìn)行功能驗(yàn)證,無卡死、宕機(jī)等現(xiàn)象、無其它異常報(bào)錯(cuò);
f)拆下冷板,檢查冷板平面度應(yīng)符合6.2.2d)中的要求。
7.5.2.3跌落試驗(yàn)
7.5.2.3.1試驗(yàn)方法:
a)測(cè)試前對(duì)人工智能加速卡外觀、結(jié)構(gòu)進(jìn)行檢查,液冷組件保持鎖緊狀態(tài);
b)運(yùn)行壓力腳本對(duì)人工智能加速卡進(jìn)行壓力測(cè)試,至少完成30分鐘壓力測(cè)試,并檢查人工智能
加速卡無異常報(bào)錯(cuò)、功能正常;
c)依次進(jìn)行2-3-5角、2-5棱、3-5棱、2-3棱、5面、6面、4面、2面、1面、3面的跌落,跌落
高度為914mm;
7.5.2.3.2合格判據(jù):
a)氣密性滿足7.3.4要求;
b)散熱性能滿足熱阻要求;
c)漏液線功能正常;
d)外觀無異常;
e)對(duì)人工智能加速卡進(jìn)行功能驗(yàn)證,無卡死、宕機(jī)等現(xiàn)象、無其它異常報(bào)錯(cuò);
f)拆下冷板,檢查冷板平面度應(yīng)符合6.2.2d)中的要求。
7.6電磁兼容性要求試驗(yàn)
搭配服務(wù)器去獲取EMCCLASSA認(rèn)證,實(shí)際設(shè)計(jì)參考GB/T17625.9—2016。
14
T/CESAXXXX—202X
參考文獻(xiàn)
[1]GB/T9813.3—2017計(jì)算機(jī)通用規(guī)范第3部分服務(wù)器
[2]GB/T4857.1—2019包裝運(yùn)輸包裝件基本試驗(yàn)第1部分:試驗(yàn)時(shí)各部位的標(biāo)示方法
[3]GB/T4857.5—1992包裝運(yùn)輸包裝件跌落試驗(yàn)方法
[4]GB/T4857.23—2021包裝運(yùn)輸包裝件基本試驗(yàn)第23部分:垂直隨機(jī)振動(dòng)試驗(yàn)方法
[5]YD/T3982—2021數(shù)據(jù)中心液冷系統(tǒng)冷卻液體技術(shù)要求和測(cè)試方法
[6]T/CESA1249.1—-2023服務(wù)器及存儲(chǔ)設(shè)備用液冷裝置技術(shù)規(guī)范第1部分:冷板
15
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
團(tuán)體標(biāo)準(zhǔn)《液冷式人工智能加速卡設(shè)計(jì)技術(shù)要求》(征求意
見稿)編制說明
一、工作簡(jiǎn)況
1.1、任務(wù)來源
本標(biāo)準(zhǔn)的編制任務(wù)來源于中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)2023年第九批團(tuán)體
標(biāo)準(zhǔn)項(xiàng)目計(jì)劃,正式批復(fù)團(tuán)體標(biāo)準(zhǔn)《液冷式人工智能加速卡設(shè)計(jì)技術(shù)要求》(項(xiàng)
目號(hào):CESA-2023-086)立項(xiàng)。技術(shù)歸單位是中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)開放
計(jì)算標(biāo)準(zhǔn)工作委員會(huì)。
1.2、起草單位
本標(biāo)準(zhǔn)由中移動(dòng)信息技術(shù)有限公司、浪潮電子信息產(chǎn)業(yè)股份有限公司牽頭,
參與單位包括上海壁仞智能科技有限公司、中科寒武紀(jì)科技股份有限公司、上海
燧原科技有限公司、寧暢信息技術(shù)有限公司、中科可控信息產(chǎn)業(yè)有限公司、新華
三技術(shù)有限公司、中航光電科技股份有限公司、史陶比爾(杭州)精密機(jī)械電子
有限公司、京東云計(jì)算有限公司、百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司等。根據(jù)
標(biāo)準(zhǔn)編寫組的任務(wù)分工,牽頭單位負(fù)責(zé)標(biāo)準(zhǔn)相關(guān)資料的搜集和調(diào)研、標(biāo)準(zhǔn)框架編
制、標(biāo)準(zhǔn)內(nèi)容起草、反饋意見整理等工作。
1.3、編制過程
主要編制過程總結(jié)如下:
(一)標(biāo)準(zhǔn)預(yù)研
為推動(dòng)液冷式人工智能加速卡部件行業(yè)應(yīng)用,提高液冷式人工智能加速卡產(chǎn)
品質(zhì)量,降低應(yīng)用門檻及制造成本,進(jìn)而有效地推廣液冷式人工智能服務(wù)器在數(shù)
據(jù)中心的應(yīng)用,從而應(yīng)對(duì)日益增加的散熱瓶頸和人工智能算力需求,有效降低數(shù)
據(jù)中心能耗,2023年4月中移動(dòng)信息技術(shù)有限公司聯(lián)合浪潮電子信息產(chǎn)業(yè)股份有
限公司、上海壁仞智能科技有限公司、中科寒武紀(jì)科技股份有限公司、上海燧原
科技有限公司對(duì)液冷式人工智能加速卡共性需求進(jìn)行了分析,初步確定了液冷式
人工智能加速卡設(shè)計(jì)技術(shù)要求的標(biāo)準(zhǔn)草案結(jié)構(gòu)和主要內(nèi)容。2023年4月至2023年9
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
月,標(biāo)準(zhǔn)工作組定期組織9次標(biāo)準(zhǔn)討論會(huì),對(duì)標(biāo)準(zhǔn)制定的必要性,可行性,目的
意義,擬解決的問題,標(biāo)準(zhǔn)范圍進(jìn)行了充分討論,最終取得技術(shù)共識(shí)。
2022年9月,中移動(dòng)信息技術(shù)有限公司聯(lián)合浪潮電子信息產(chǎn)業(yè)股份有限公司,
共同向冷板制造商,流體快插接頭制造商,人工智能芯片廠商,人工智能服務(wù)器
集成商,人工智能服務(wù)器設(shè)備使用方發(fā)起參編邀請(qǐng),各意向參編單位對(duì)于該標(biāo)準(zhǔn)
制定的必要性,可行性,目的意義,擬解決的問題表示一致認(rèn)同并共同推進(jìn)標(biāo)準(zhǔn)
立項(xiàng)。
(二)標(biāo)準(zhǔn)立項(xiàng)
2023年10月,中移動(dòng)信息技術(shù)有限公司、浪潮電子信息產(chǎn)業(yè)股份有限公司牽
頭,聯(lián)合上海壁仞智能科技有限公司、中科寒武紀(jì)科技股份有限公司、上海燧原
科技有限公司、寧暢信息技術(shù)有限公司、中科可控信息產(chǎn)業(yè)有限公司、新華三技
術(shù)有限公司、中航光電科技股份有限公司、史陶比爾(杭州)精密機(jī)械電子有限
公司、京東云計(jì)算有限公司、百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司作為共同發(fā)起
方申請(qǐng)立項(xiàng),并通過評(píng)審,成為協(xié)會(huì)正式標(biāo)準(zhǔn)制定項(xiàng)目。
(三)標(biāo)準(zhǔn)編制
2023年10月,標(biāo)準(zhǔn)工作組完成了面向工作組內(nèi)成員單位的標(biāo)準(zhǔn)意見征集,并
組織召開了標(biāo)準(zhǔn)啟動(dòng)會(huì),對(duì)標(biāo)準(zhǔn)制定的背景、參編單位構(gòu)成,標(biāo)準(zhǔn)推動(dòng)計(jì)劃進(jìn)行
了介紹。同時(shí)對(duì)標(biāo)準(zhǔn)范圍等相關(guān)意見進(jìn)行了討論。
2023年11月-2024年2月,標(biāo)準(zhǔn)工作組組織召開五次討論會(huì),重點(diǎn)對(duì)人工智能
加速卡的設(shè)計(jì)、外觀、結(jié)構(gòu)、熱性能、環(huán)境適應(yīng)性、多卡互連的設(shè)計(jì)要求等相關(guān)
意見進(jìn)行了討論。
2024年3月21日,標(biāo)準(zhǔn)工作組組織召開討論會(huì),重點(diǎn)對(duì)設(shè)計(jì)、外觀、結(jié)構(gòu)、
承壓、熱性能、環(huán)境適應(yīng)性試驗(yàn)方法的相關(guān)意見進(jìn)行了討論。
2024年4月11日,標(biāo)準(zhǔn)工作組組織召開討論會(huì),重點(diǎn)對(duì)沖擊適用性測(cè)試、運(yùn)
輸包裝件跌落測(cè)試、氣密性檢測(cè)、高低溫試驗(yàn)、高溫高濕試驗(yàn)、測(cè)試的適用性等
相關(guān)意見進(jìn)行了討論。結(jié)合歷次標(biāo)準(zhǔn)工作組會(huì)議上對(duì)標(biāo)準(zhǔn)意見的處理情況,牽頭
單位完成對(duì)標(biāo)準(zhǔn)草案的刷新,形成征求意見稿。
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
2024年4月25日,標(biāo)準(zhǔn)工作組組織召開討論會(huì),對(duì)氣密性試驗(yàn)方法和判據(jù)進(jìn)
行了討論;標(biāo)準(zhǔn)工作組完成對(duì)征求意見稿的確認(rèn),并對(duì)當(dāng)前征求意見稿中是否涉
及知識(shí)產(chǎn)權(quán)信息進(jìn)行了檢索和反饋。
2024年5月16日,標(biāo)準(zhǔn)工作組組織召開討論會(huì),重點(diǎn)結(jié)合實(shí)際試驗(yàn)報(bào)告,對(duì)
氣密性試驗(yàn)方法和判據(jù)再次進(jìn)行了討論;并刷新征求意見稿。
2024年5月30日,標(biāo)準(zhǔn)工作組完成對(duì)征求意見稿刷新的確認(rèn)。
二、標(biāo)準(zhǔn)編制原則和確定主要內(nèi)容的論據(jù)及解決的主要問題
2.1、編制原則
在標(biāo)準(zhǔn)編制過程中考慮到液冷式人工智能加速卡的特點(diǎn),遵循了以下五方面
的原則。
a)符合性:遵循國(guó)家法律、法規(guī)等相關(guān)規(guī)定,制定過程嚴(yán)格按照程序
執(zhí)行。
b)先進(jìn)性:本標(biāo)準(zhǔn)制定過程中充分考慮了人工智能芯片和冷板的技術(shù)
發(fā)展,并在方面保持了一定的前瞻性。
c)適用性:當(dāng)前國(guó)內(nèi)的人工智能加速卡仍以風(fēng)冷散熱為主,沒有液冷
式人工智能加速卡的設(shè)計(jì)標(biāo)準(zhǔn),一定程度上影響了液冷式散熱技術(shù)
在人工智能加速卡領(lǐng)域的普及。本標(biāo)準(zhǔn)規(guī)范液冷式人工智能加速卡
的構(gòu)成及技術(shù)規(guī)格,指導(dǎo)液冷式人工智能加速卡的設(shè)計(jì)、制造、采
購和評(píng)價(jià)活動(dòng),解決由于標(biāo)準(zhǔn)不統(tǒng)一所導(dǎo)致的組件高度定制,產(chǎn)業(yè)
生態(tài)蕭索,生態(tài)鏈不完整等問題。為液冷式人工智能加速卡產(chǎn)品的
品質(zhì)保證提供統(tǒng)一的衡量標(biāo)準(zhǔn),為制造商生產(chǎn)液冷式人工智能服務(wù)
器、為最終用戶的產(chǎn)品選型、為液冷式人工智能服務(wù)器產(chǎn)品市場(chǎng)準(zhǔn)
入提供依據(jù)。
d)中立性:本文件制定過程中編制組成員單位對(duì)標(biāo)準(zhǔn)文本進(jìn)行了充分
討論。
e)科學(xué)性:本標(biāo)準(zhǔn)主要解決市場(chǎng)中由于標(biāo)準(zhǔn)不統(tǒng)一所帶來的生態(tài)構(gòu)建
和產(chǎn)業(yè)化推廣問題,給液冷式人工智能加速卡的設(shè)計(jì)提供了標(biāo)準(zhǔn)支
撐,同時(shí)有助于液冷式人工智能服務(wù)器生態(tài)構(gòu)建和完善,實(shí)現(xiàn)大規(guī)
模部署,進(jìn)而帶來綠色節(jié)能、快速交付、便捷運(yùn)維等收益。本標(biāo)準(zhǔn)
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)
與國(guó)內(nèi)行業(yè)標(biāo)準(zhǔn)協(xié)調(diào)一致,參考國(guó)內(nèi)團(tuán)體標(biāo)準(zhǔn),制定液冷式人工智
能加速卡設(shè)計(jì)技術(shù)要求。本文件技術(shù)指標(biāo)科學(xué)合理并可驗(yàn)證,試驗(yàn)
方法具有穩(wěn)定性。
2.2、主要內(nèi)容
本標(biāo)準(zhǔn)規(guī)定了采用冷板式液冷散熱的標(biāo)準(zhǔn)PCIe接口形態(tài)的人工智能加速卡
設(shè)計(jì)要求和技術(shù)要求,并描述了相關(guān)技術(shù)要求的試驗(yàn)方法。本標(biāo)準(zhǔn)適用于采用冷
板式液冷散熱的標(biāo)準(zhǔn)PCIe接口形態(tài)的人工智能加速卡/服務(wù)器的設(shè)計(jì)、制造和測(cè)
評(píng),其它結(jié)構(gòu)形態(tài)的插卡式人工智能加速卡的冷
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨境電商直播基地共建協(xié)議
- 企業(yè)員工培訓(xùn)發(fā)展方案
- 應(yīng)急管理局年度安全培訓(xùn)課件
- 應(yīng)急疏散演練前安全培訓(xùn)課件
- 平臺(tái)運(yùn)營(yíng)2026年運(yùn)營(yíng)管理協(xié)議
- 2026年醫(yī)療AI輔助診斷服務(wù)合同協(xié)議
- 企業(yè)員工培訓(xùn)管理制度
- 應(yīng)急安全培訓(xùn)室生產(chǎn)公司課件
- 小微企業(yè)減稅降費(fèi)政策執(zhí)行的困境與突破:以D縣為例
- 小學(xué)音樂課堂中模糊教學(xué)法的多維審視:優(yōu)勢(shì)、局限與融合策略
- 電子數(shù)據(jù)取證分析師安全培訓(xùn)水平考核試卷含答案
- 2026中國(guó)石油大學(xué)(北京)非教師崗位招聘24人筆試模擬試題及答案解析
- 門診年度總結(jié)
- 沈陽盛京軍勝農(nóng)業(yè)發(fā)展科技有限公司及所屬企業(yè)2025年面向社會(huì)招聘?jìng)淇碱}庫帶答案詳解
- 2025年監(jiān)理工程師考試案例分析(土木建筑)真題答案(完整版)
- 2025 新能源電力交易實(shí)戰(zhàn)指南
- 血液凈化中心(透析室)年度述職報(bào)告
- 教科版(2024)二年級(jí)科學(xué)上冊(cè)期末綜合質(zhì)量調(diào)研卷(含答案)
- 2025年合肥安徽潛晟城市運(yùn)營(yíng)管理有限公司公開招聘工作人員考試題庫必考題
- 新生兒氣道管理臨床實(shí)踐指南(2025版)
- 酒吧消防安培訓(xùn)
評(píng)論
0/150
提交評(píng)論