版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
智算產(chǎn)業(yè)發(fā)展研究報告中國電信研究院(天翼智庫)中國電信研究院(天翼智庫)2智算產(chǎn)業(yè)發(fā)展研究報告3一、全球智算產(chǎn)業(yè)新動向 41、智能算力將成為AI發(fā)展的關鍵支撐與引擎 42、AI投資熱潮推動智算產(chǎn)業(yè)進入快速增長期 53、智算產(chǎn)業(yè)開啟“速度”與“質量”并行 84、智算產(chǎn)業(yè)發(fā)展的幾點認識 10二、智算產(chǎn)業(yè)圖譜 1、智算基礎設施:全球建設如火如荼,國產(chǎn)化進程加速 132、大模型平臺服務:國內外云廠商模式創(chuàng)新,差異化布局 143、行業(yè)應用:全球進入應用元年,智算能力全面升級 4、智算集成服務:ToB市場火熱,智算集成釋放巨大潛力 三、智算發(fā)展七大趨勢預判 趨勢一:軟硬協(xié)同優(yōu)化助力大模型降本增效 趨勢二:高質量數(shù)據(jù)集是大模型能力躍遷的關鍵 趨勢三:超大規(guī)模智算集群成為人工智能發(fā)展基石 趨勢四:算力服務由資源租賃向平臺化、一體化供給演進 趨勢五:AIAgent(智能體)將成為智能交互的新流量入口 29趨勢六:AI技術設備加速AIDC基礎設施升級 31趨勢七:算力與電力協(xié)同發(fā)展成為新態(tài)勢 32四、智算技術發(fā)展的六大關鍵詞 33關鍵詞1:MoE 33關鍵詞2:具身智能 35關鍵詞3:分布式智算中心網(wǎng)絡 36關鍵詞4:存算一體 37關鍵詞5:空心光纖 39關鍵詞6:算電聯(lián)合調度 40關鍵技術成熟度評估 42五、智算發(fā)展?jié)摿υu估 441、評估方法 442、評估結果 46六、典型案例 1、中國電信上海萬卡集群 2、中國電信京津冀智算中心跨智算中心無損網(wǎng)絡解決方案 513、中國電信湖北中部綠色智算中心 544、海蘭云海底數(shù)據(jù)中心 57七、總結與展望 59八、附錄-智算評估實施方案 1、評估指標模型構建 602、評估指標賦值 613、評估指標權重設計 614、各省評估得分 63九、參考文獻 4(一)AI推動算力需求超線性發(fā)展,智能算力需求井噴。根據(jù)EPOCHAI數(shù)據(jù),全球人工智能經(jīng)歷從傳統(tǒng)模型進入深度學習階段,模型所需算力規(guī)模年增長1.5倍突破至4.1倍/年,算力規(guī)模實現(xiàn)7大參數(shù)模型、高質量數(shù)據(jù)集和大算力(智算)成為AI大模型發(fā)展的關鍵要素,Scaling法則帶動大模型不斷突破新的瓶頸。需算力至少為萬卡級規(guī)模以上(參考A100),持續(xù)訓練周期為周級5智能化應用,相當于過去40年間的應用數(shù)總和[2],在巨大的應用藍海市場面前,算力缺口顯著。Sora、GPT-4o、Gemini等多模態(tài)大模階段的算力需求是大語言模型170+倍;推理階段,即完成一項常規(guī)(二)智算正在成為我國算力主賽道。2023年我國算力總規(guī)模達到230EFLOPS,近五年年均增速發(fā)布《算力基礎設施高質量發(fā)展行動計劃》,明確了到2025年算力規(guī)模超過300EFlops,智能算力占比達到35%。多省跟進總體目標,上海、廣東等省提出到2025年智能算力在總算力中占比達到50%及2024年7月國務院“推動高質量發(fā)展”新聞發(fā)布會上,國資委AI賦能產(chǎn)業(yè)煥新工作計劃“有序推進智算中心和算力調度做強智能算力供給”。多國政府將AI基礎設施上升至國家戰(zhàn)略,持續(xù)加大投資及政策6對AI基礎技術、算力基礎設施等出臺一攬子投資舉措。美國瞄準細分領域,2024財年AI投資預算增長至31億美元,創(chuàng)歷史新高;對年增強,并于2024年9月美國政府宣布成立AI基礎設施的全球領先優(yōu)勢。加拿大政府2024年4月宣布24億加元AI投資舉措,通過AI開發(fā)和使用來提高生產(chǎn)力。其中20億加元為AI研究人員、初創(chuàng)企業(yè)和規(guī)?;髽I(yè)提供算力和技術基礎設施。于購買新的AI專用計算資源或升級現(xiàn)有基礎設施。沙特致力于成為全球人工智能中心。2024年3月沙特阿拉伯稱將啟動成立一只高達業(yè)、芯片制造商和數(shù)據(jù)中心擴張。沙特阿美旗下風投公司W(wǎng)a'edVentures(實際上是沙特的投資工具)近期圍繞AI芯片、AI平臺持續(xù)投資,加快沙特在全球AI競賽中布局?!皣掖蠡稹?、“算力券”“模型券”等方式支持AI產(chǎn)業(yè)發(fā)展。體產(chǎn)業(yè)的持續(xù)發(fā)展、促進半導體以及芯片技術的創(chuàng)新。2024年2月7化算力體系”。資本市場加大AI投資力度,基礎設施及模型成為資本關注重點累計發(fā)生投資事件170次,融資次數(shù)快速增長了178.7%。到目前為七家科技巨頭1(下圖所示M7)已將AI作為競爭焦點,尤其是AI硬件層和AI模型層的競爭正在升溫[3]。摩根士丹利認為,算力周期的8頭部科技公司持續(xù)加強全球化AI基礎設施布局。OpenAI正計劃尼、法國等國家地區(qū)建設人工智能中心、擴大AI基礎設施、培訓AI勞動力技能等;三星電子表示將在美國、韓國成立半導體AGI(通用人工智能)計算實驗室;字節(jié)投資21.3億美元在馬來西亞建立人工2023年1月,美國商務部國家標準與技術研究院發(fā)布《人工智能風9里程碑意義。2024年5月,美國參議院人工智能工作組發(fā)布《推動美國在AI領域的創(chuàng)新:參議院AI政策路線圖》。歐盟展現(xiàn)領先全球的立法速度。2024年3月,其發(fā)布的《人工智能法案》被認為是全2024年世界人工智能大會提出“選取人工智能技術發(fā)展中最直觀量展。2024年政府工作報告明確提出,“加快形成全國一體化算力體展態(tài)勢,帶動價格持續(xù)飆升,如英偉達H100首發(fā)價為3.5萬美元,萬卡/十萬卡發(fā)展,AI加速卡及系統(tǒng)搭建成本占據(jù)模型訓練比例高(60%~)[7],未來將逐步向平臺及應用轉移。該現(xiàn)象將進一步加劇。國內人工智能技術加速向行業(yè)滲透,疊加西方對我國的算力封鎖持續(xù)加碼,國產(chǎn)智算產(chǎn)業(yè)鏈正在加速構建。目前已形成縱向包含智算基礎設施、大模型平臺服務、行業(yè)應用;橫向提供算力資源集成服務的“三縱一橫”龐大產(chǎn)業(yè)鏈。如圖所示:智算基礎設施是產(chǎn)業(yè)鏈上游,包括AI芯片、AI服務器、智算中心等;上游供應商主要以租賃形式為客戶提供一站式智算服務,包括面向生成式AI和非生成式AI兩個細分市場。據(jù)IDC報告,2023年下半年智算基礎設施市場規(guī)模78.1億元,同比增長86%;從全年情況看,2023年較上一年全年智算服務市場增長81.6億元,生成式AI市場增量貢獻59%,是主要驅動力;非生成式AI市場僅貢獻3%的增量[8]。智算中心建設提速,呈現(xiàn)集群化、靈活調度特征。根據(jù)賽迪顧問數(shù)據(jù)顯示,2024年上半年,全國已經(jīng)建設和正在建設的智算中心超過250個,招投標事件791起,同比增長高達407.1%;已有超20個城市建設了智算中心,其中既有北京、上海等一線城市,也有鄭州、武漢等中心地區(qū)城市,還有內蒙、寧夏等西部城市,目前正在加速向縣城下沉。從建設主體來看,頭部大模型廠商與云商選擇適度超前建設超大規(guī)模智算集群,如Meta為訓練LLaMA3構建2個2.4萬卡集群,并計劃2024年底搭建35萬卡集群;字節(jié)跳動、百度等已建立萬卡級智算集群,主要面向自有大模型訓練。截至5月底,全國規(guī)劃具有超萬張GPU集群的智算中心已達十余個。其中,三大運營商加大國產(chǎn)GPU的應用,預計2024年將建成6個萬卡集群智算中心,已投產(chǎn)使用近3萬張國產(chǎn)GPU。云實現(xiàn)智能算力資源的靈活調度。信通院聯(lián)合中國電信打造“全國一體化算力算網(wǎng)調度平臺”,是我國首個實現(xiàn)多元異構算力資源調度的全國性平臺,目前天翼云、華為云、阿里云等云商均已接入。除此之外,云商也紛紛基于自身云底座實現(xiàn)算力調度,如青云打造“AI算力調度平臺+AI算力云服務”,前者打破算力邊界,延申算力從中心到邊緣到端側,對算力資源進行統(tǒng)一調度、管理、運營;后者基于青云的云服務,聯(lián)合生態(tài)共同對外提供AI產(chǎn)業(yè)鏈上的服務。AI芯片供不應求,國產(chǎn)化萬卡級集群量質同步提升。據(jù)Gartner預測,2024年AI芯片市場規(guī)模將較上一年增長25.6%,達到671億美元;預計到2027年,AI芯片市場規(guī)模將達到1194億美元。英偉達憑借成熟的CUDA軟件生態(tài),壟斷高性能人工智能芯片市場,2023年在數(shù)據(jù)中心GPU占據(jù)了98%的市場份額,總收入達362億美元(約2626.9億元);自身芯片產(chǎn)業(yè)加速形成。根年提升4個百分點,國產(chǎn)化能力穩(wěn)步提升。國產(chǎn)AI芯片廠商面向AI推理和AI訓練需求持續(xù)發(fā)力,芯片架構呈現(xiàn)出多元化,國內多個萬卡級智算集群投入運營,自主能力不斷提升。運營商依托華為910B構建多個萬卡級集群,燧原科技國產(chǎn)萬卡集群在慶陽點大模型平臺服務是產(chǎn)業(yè)鏈中游,供應商提供API等工具供用戶靈活調用其基礎大模型,并針對不同業(yè)務場景,開發(fā)、訓練和部署專屬大模型。據(jù)NTCysd預測,到2026年我國MaaS(模型即服務)市場規(guī)模有望突破130億元;2023-2026年復合增長率為117.9%[9]。云平臺提供從數(shù)據(jù)、模型到應用服務的全周期管理和工具。國外云廠商的MaaS服務專注于構建通用能力。國外云廠商利用自身基礎設施優(yōu)勢,開發(fā)全流程工具和套件,滿足用戶對模型預訓練、模型精調、模型部署、智能應用開發(fā)等多樣化需求。微軟云的AzureOpenAI服務,支持開發(fā)者調用OpenAIGPT-4、GPT-3、Codex和DALL-E等模型的API來構建、微調模型,Azure主要提供一些通用型功能,如安全性、合規(guī)性和區(qū)域可用性等。亞馬遜AWS的SageMaker服務,為大型語言模型提供了全生命周期管理工具,研發(fā)者可用它進行大模型的訓練、微調和部署,并且與AWS的其他服務無縫集成。MaaS服務極大帶動了云商收入增長。Microsoft、Google、Amazon云收入增速自23Q3逐步提升,24Q1三家公司云收入同比增速分別為31%、28%、17%。國內云廠商的MaaS服務強調搭建生態(tài)。除了通用能力外,國內云廠商還會參與開發(fā)垂直行業(yè)大模型、集成軟硬件服務。騰訊云依托TI平臺打造一站式行業(yè)大模型精選商店,其中包含了騰訊企點、騰訊會議、騰訊云AI代碼助手等多款頭部SaaS產(chǎn)品,并啟動與金融、文旅等數(shù)十個行業(yè)客戶共建行業(yè)大模型。華為云在其MaaS服務平臺“ModelArts”上推出了“昇思大模型服務”,支持跨平臺的模型部署與推理,用戶可一鍵式遠程調用昇思NPU芯片的海量算力,大幅縮短推理等待時間,避免在本地部署NPU芯片的繁重操作。百度云基于其MaaS服務平臺“千帆”,推出了千帆AI原生應用商店,成為大模型商業(yè)機會的匯集地,為商家提供品牌曝光、流量支持和銷售資源等支持。我國大模型數(shù)量及規(guī)??焖僭鲩L,能力逼近GPT-4。根據(jù)信通院《全球數(shù)字經(jīng)濟白皮書(2024)》數(shù)據(jù),全球人工智能大模型1328個(包含同一企業(yè)、同一模型的不同參數(shù)版本美國數(shù)量占比44%位居第一,我國數(shù)量占比36%位居第二[10];據(jù)大模型之家預測,預計到2028年全球大模型市場規(guī)模將達到1095億美元;我國大模型市場將達1179億元。百度文心一言、訊飛星火、清華零一萬物的千億參數(shù)閉源大模型Yi-Large在最新總榜中排名世其中文分榜更是與GPT-4o并列第一??萍季揞^加大AI產(chǎn)品賦能,ToB市場初見商業(yè)化成效。微軟旗下的GitHubCopilotforBusiness已有超過2.7萬家組織用于提高開發(fā)人員生產(chǎn)力,超過6.3萬家組織在PowerPlatform中使用了AI驅動的功能且環(huán)比增長75%;微軟將旗下的Microsoft365Copilot定價提升至30美金/人/月。Salesforce從推出首個生成式AI客戶關系管理應用EinsteinGPT開始,全面擁抱生成式AI,推出AICloud系列應用;并隨著Einstein模塊用量增大,宣布提價。我國大模型正加速邁向行業(yè)縱深,賦能應用場景。從行業(yè)看,據(jù)賽迪《2024年中國人工智能行業(yè)典型大模型100強企業(yè)》披露,金融、工業(yè)、政務三大行業(yè)因信息化基礎好、數(shù)據(jù)結構化程度高、應用場景相對成熟,100強企業(yè)在這三個行業(yè)有落地應用的企業(yè)數(shù)量最多;醫(yī)療、交通兩大行業(yè)數(shù)據(jù)豐富、應用場景眾多,較多企業(yè)開展探索,處于第二梯隊[11]。從場景看,騰訊研究院總結大模型落地的快慢呈現(xiàn)“微笑曲線”的特征,即產(chǎn)業(yè)鏈高附加價值的兩端(研發(fā)/設計和營銷/服務大模型應用落地較快;而在低附加價值的中部(生產(chǎn)、組裝等),大模型應用進程較慢[12]。金融行業(yè)是AI滲透率領先行業(yè),大模型驅動金融業(yè)務場景革新。據(jù)前瞻產(chǎn)業(yè)研究院預測,2025年我國智慧金融市場規(guī)模將達3638億元[13]。金融行業(yè)由于數(shù)字化基礎好(數(shù)字化轉型超90%以上)、具備支付能力(行業(yè)本身盈利能力強)等特征,成為目前AI大模型覆蓋最多的行業(yè)。AI+金融應用目前已覆蓋產(chǎn)品設計、市場營銷、風險控制、客戶服務、支持性活動,形成覆蓋全生命周期、一系列配套的解決方案,推動金融行業(yè)高質量發(fā)展。如中國人壽聯(lián)手第四范式基于AI大模型打造智能核保系統(tǒng),實現(xiàn)了自動、精準、個性的核保決策;打造智能理賠系統(tǒng),以最快速度自動、公正處理理賠,有效降低理賠成本和風險、提升理賠效率。建設銀行啟動“方舟計劃”,打造具備大模型、大算力、大數(shù)據(jù)的金融大模型基座與能力體系,推進AI技術在智能客服、智能運營、智能風控等場景的應用,渠道綜合化運營,旗艦類、綜合類網(wǎng)點占比提升2.86個百分點,基層網(wǎng)點減負賦能成效顯現(xiàn)。醫(yī)療場景融合AI將釋放豐富價值,目前AI醫(yī)療項目建設方式多樣化。據(jù)前瞻產(chǎn)業(yè)研究院預測,2028年我國智慧醫(yī)療市場規(guī)模將達2332億元[13]。AI大模型可賦能醫(yī)療行業(yè)“醫(yī)、教、研、管”等場景的各個環(huán)節(jié)。醫(yī)療機構:可提升管理效率;醫(yī)護群體:可輔助科學診療;制藥企業(yè):可降研發(fā)成本提生產(chǎn)效率;病患群體:可縮小醫(yī)療資源不均矛盾,因此醫(yī)療行業(yè)可借助AI實現(xiàn)商業(yè)、人文等豐富價值。友誼醫(yī)院聯(lián)合信通院成立“算力+醫(yī)療健康工作組”,共同探索算力在醫(yī)療健康領域的應用場景與發(fā)展趨勢;醫(yī)渡科技與華為合作啟動醫(yī)療大模型聯(lián)合創(chuàng)新,基于昇騰AI硬件,推出面向B端的訓推一體機解決方案,醫(yī)院可以根據(jù)自身需求來購置相應設備;國內AI制藥頭部企業(yè)晶泰科技選擇自主建設AI藥物研發(fā)所需的算法平臺與高性能計算算力平臺。工業(yè)算力分布在云-邊-端,但應用普及率仍有較大提升空間。據(jù)Capgemini統(tǒng)計數(shù)據(jù)顯示,歐洲頂級制造企業(yè)的AI應用普及率超30%,日本和美國制造企業(yè)的AI應用率分別達到了30%和28%。相較于這些發(fā)達國家,我國制造企業(yè)AI普及率尚不足11%。目前我國工業(yè)算力有四種典型應用場景1)邊緣算力:多個計算能力較弱的工業(yè)終端,將計算任務或數(shù)據(jù)遷移到鄰近的邊緣計算設備,實現(xiàn)數(shù)采、分析、檢測、控制等功能。(2)云化服務:將云資源池以容器或虛機的形式劃分出來,遠程為工業(yè)產(chǎn)線提供應用服務,具有靈活重新配置、成本較低和軟件故障恢復快等優(yōu)勢。(3)群智算力:是指在缺乏邊緣計算和云計算資源時,利用存在計算/數(shù)據(jù)依賴的多個生產(chǎn)設備之間,調整任務分配,使得整個設備集群的計算任務具有實時性。(4)算力協(xié)同:該模式充分利用了邊緣計算的實時性和云計算的大量資源,可以逐級部署計算任務,在計算能力和實時性之間取得折中。智算集成服務主要是指廠商在幫助客戶建設私有智算基礎設施過程中提供的咨詢、集成、開發(fā)、運維等專業(yè)和管理服務。據(jù)IDC報告,2023年下半年智算集成服務市場規(guī)模36億元,同比增速129.4%[8]。智算集成服務市場呈現(xiàn)出“一超多強”的特征。華為依托其領先的芯片能力及全棧服務能力,市場份額領先,同時,華為可為客戶提供完整的從咨詢規(guī)劃、平臺建設、模型開發(fā)、集成實施到輔助運營等全生命周期服務,通過3+1算力產(chǎn)業(yè)體系—“算力、存力、運力”基礎設施以及智算服務,助力客戶打造多樣性算力中心;新華三通過圖靈小鎮(zhèn)(產(chǎn)業(yè)鏈式發(fā)展)模式、百度依托建、管、運的服務式思維不斷取得各地政府的認可;寒武紀同樣依托其領先的推理芯片及全棧服務參與多地臺州、沈陽等多地算力基礎設施建設項目;中國電子云依托“CECSTACKV5一體化算力平臺”為客戶提供智算和高性能計算基礎設施,相關智算中心項目目前已在北京、石家莊、武漢等地正式落地。大模型降價搶占ToB市場,推動大模型在各行各業(yè)應用落地。麥肯錫的研究報告顯示,應用生成式AI大模型每年為企業(yè)端(即2B)帶來的經(jīng)濟價值為2.6-4.4萬億美元[14],大模型對ToB用戶吸引力旺盛。在掌握“企業(yè)一旦使用一家大模型,替換成本極高”的普遍規(guī)律后,大模型廠商通過降價提前卡位,推動自身大模型產(chǎn)品被更多B端企業(yè)應用,建立數(shù)據(jù)飛輪,強化用戶粘性,進而加速構建AI開發(fā)生態(tài)。5月字節(jié)豆包大模型降至0.0008元/千Tokens;緊接著阿里宣布其主力模型全面降至0.0005元/千Tokens,其通義旗下的12款模型已開源,全部免費下載;百度緊跟上宣布最新兩款主力模型“免費,立即生效”;而后參與者又多了科大訊飛和騰訊。面向開發(fā)者打造社區(qū)生態(tài)。百度推出的一眾包括飛槳在內的開發(fā)社區(qū);阿里的魔搭社區(qū)致力于以開源力量助力中國類Sora模型的探索和創(chuàng)新。如何平衡性能和成本成為大模型發(fā)展面臨主要難題。根據(jù)斯坦福大學發(fā)布的《2024年人工智能指數(shù)報告》,訓練成本隨著模型規(guī)模增加而急劇上升,如2017年的Transformer模型訓練成本約為900美元,而2023年的GPT-4和Google的GeminiUltra的訓練成本分別約為7800萬美元和1.91億美元[15]。圖92017-2023年部分AI大模型的訓練成本估算追求長期降本和供應安全,大型企業(yè)發(fā)力AI芯片自研。隨著AI算力需求和英偉達芯片價格持續(xù)高漲,國外頭部云商及科技企業(yè)加快自研AI芯片,如谷歌TPUv5、微軟Maia100、亞馬遜Trainium、Meta的MITAV1等??紤]到供應鏈的穩(wěn)定性,國內芯片廠商及大型企業(yè)加快推進AI芯片國產(chǎn)化進程,如華為昇騰910B、寒武紀MLU370、摩爾線程MTTS4000、海光DCU、百度昆侖芯等。采用“分時復用”策略和系統(tǒng)級優(yōu)化手段,提升算力利用率和訓練效率。一方面,借助需求預測和任務調度等方法,在高峰期給新興業(yè)務分配更多算力資源,而在低峰期將多余的算力資源重新分配給其他業(yè)務或用戶,以提高整體的算力使用效率。另一方面,通過數(shù)據(jù)并行、張量并行、流水線并行、分組參數(shù)切片并行等多種并行加速策略,結合通信、容災及監(jiān)控工具,搭建大模型訓練/生產(chǎn)系統(tǒng),加快大模型訓練和調優(yōu)速度,并降低人員操作Megatron-LM、清華大學BMTrain、百度飛槳PaddePaddle等。從模型技術創(chuàng)新角度切入,主流企業(yè)加快研發(fā)MoE大模型以平衡模型升級效果及成本?;赥ransformer的MoE已成大模型主流架構,谷歌、OpenAI、阿里、華為、騰訊、昆侖萬維、MiniMax等國內外主流企業(yè)加快推進MoE大模型布局和落地。2024年,全球MoE大模型數(shù)量呈爆發(fā)增長態(tài)勢。據(jù)公開統(tǒng)計,2024年1-5月全球發(fā)布MoE通用大模型數(shù)量約20個,遠超2021-2023三年總量(約10個),且以多模態(tài)大模型為主(占比約90%)。OpenAI強調,增加大模型的參數(shù)量不再是提升大模型能力的最有效模型為中心”AI范式主要圍繞模型進行迭代、優(yōu)化設計,數(shù)據(jù)集相13萬億個token),Llama2相比Llama1相比,訓練數(shù)據(jù)規(guī)模年我國數(shù)據(jù)標注及審核市場中定制化服務占比85.41%,而標準化的開發(fā)新范式,微調是讓AI獲取特定領域知識,并賦予其組織、應用合成數(shù)據(jù)是模型能力躍遷的關鍵。根據(jù)EpochAIResearch團年耗盡[16]。為了解決高質量數(shù)據(jù)不足的問題,OpenAI主要采用合成數(shù)據(jù)的方法,即借助生成對抗網(wǎng)絡(GAN)來生成數(shù)據(jù)。Gartner預萬卡集群成為大模型軍備賽的標配。生成式AI的演進推動底層其他專用AI加速芯片),充分整合高性能GPU計算、高性能存儲以及網(wǎng)絡、智算平臺等關鍵技術,將各類底層基礎設施整合成為一臺實現(xiàn)模型能力的快速迭代。如OpenAI訓練GPT4在大約2萬個A100AI與超算基礎設施融合,推動科研范式變遷與生產(chǎn)效率提升。單TOP500統(tǒng)計,排名前十的超級計算機中有8臺使用CPU+GPU異構架構,其中超級計算機Aurora、Summit在系統(tǒng)設計時均面向人工智能場景進行優(yōu)化。2023年以來,隨著以ChatGPT為代表的大模型的崛起,全球主要國家積極將AI技術融入超算應用場景,在生物、氣的面向生物醫(yī)藥場景生成式AI模型,將計算性能提升60%。進一步型訓練的智能算力節(jié)點內部大多采用InfiniBand技術成本偏高、開放性較弱,因此業(yè)界也在考慮用RoCEv2等無損網(wǎng)絡技如重慶算力互聯(lián)公共服務平臺7月正式上線,首批接入算力提供商MaaS屏蔽底層差異,基于算力服務平臺跨越模型供給側與用戶內云商MaaS平臺均支持多種機器學習算法和大模型,并提供低代碼器學習平臺+算力”為大模型企業(yè)提供算力基礎設施及平臺,同時通趨勢五:AIAgent(智能體)將成為智能交互智能終端搭載多模態(tài)大模型,加速轉型升級。依托輕量化大模型的原生智能終端將成為主流。各大廠商、云商、機器人廠商紛紛加快大模型從云端向到終端轉移,如高通推出首個在Android智能手機上運行的具有超70億參數(shù)的語言和視覺助理大模型LLaVA。聯(lián)發(fā)科聯(lián)手OPPO和VIVO,在搭載天璣9300芯片的手機上,運行語言大模型Llama2和視頻生成AI模型StableDiffusion。華為、達闥等企業(yè)已推出5G云端機器人,通過云端大模型訓練迭代與機器人端側交互,實現(xiàn)機器人之間的學習和知識共享。小鵬汽車已在智能座艙場景中新增接入阿里云通義千問大模型賦能終端應用及工具智能升級,AIAgent逐漸成為大模型行業(yè)落地的主要方式。據(jù)MarketsandMarkets2024調研報告《AutonomousAlandAutonomousAgentsMarket》預測,至2028年全球AIAgent市場規(guī)模將達到285億美元,2023-2028年CAGR將達到43.0%[18]。以AIAgents形式的模型應用將迎來爆發(fā)。目前OpenAl的GPTS和GPT-Store已成為Agent生態(tài)雛形。字節(jié)推(Moonshot)、通義千問等大模型,面向2C用戶快速創(chuàng)建各類聊天機器人,并一鍵發(fā)布到不同社交媒體與消息應用當中,如飛書、微信公眾號、豆包等渠道。阿里釘釘利用大模型重塑20+條產(chǎn)品線,面向2B用戶推出AIAgent產(chǎn)品提供處理文檔、編寫方案等一站式助理服務。目前釘釘已上線200+位AI助理,覆蓋辦公、生活、娛樂等多個場景,已有超過220萬家企業(yè)采用釘釘AI助理。圖14基于LLM驅動的Agents基本框架[19]AI技術設備高功率、高密度、高彈性對數(shù)據(jù)中心能源基礎設施加速芯片,支持大規(guī)模AI模型的訓練和推理,引發(fā)數(shù)據(jù)中心基礎設發(fā)布了《數(shù)據(jù)中心綠色低碳發(fā)展專項行動計劃》,對AI發(fā)展驅動下的新建和改造數(shù)據(jù)中心建設提出了6方面的重點任務。配電制冷彈性建設、綠電儲能創(chuàng)新部署、智能化運維管理成為制冷等配套彈性建設模式。如全面推進智能小母線+彈性方艙的供電資源彈性適配,預留風冷+液冷等接口靈活調度冷量,并根據(jù)液冷和引擎,可根據(jù)AIDC運行狀態(tài)實時匹配合理的服務容量與資源,助于解決算力增長和電力消耗矛盾,推動算力和電力協(xié)同發(fā)展是必由路徑。智能算力的高能耗特征日益顯著,算力能源消耗呈現(xiàn)快速增長趨勢,預計到2030年我國算力用電需求將接近當前的3倍左右。超大集群供電承壓、東部算電能源短缺、綠電使用占比低成為制約算力發(fā)展的三大用能結構“瓶頸”。以算力用電需求為導向,通過政策機制、技術架構等創(chuàng)新,推進算力和電力產(chǎn)業(yè)的協(xié)同融合發(fā)展,成為近年來我國算力發(fā)展的政策推進重點,如《算力基礎設施高質量發(fā)展行動計劃》、《數(shù)據(jù)中心綠色低碳發(fā)展專項行動計劃》,均明確提出創(chuàng)新算力電力協(xié)同機制。加大算力與電力在布局、市場和調度等方面融合發(fā)展成為算電協(xié)同重點方向。一是算電布局協(xié)同,解決電力資源與算力用能的空間供需不平衡,統(tǒng)籌東西部的電力和算力輸送格局,加強電力和算力“雙向奔赴”,構建面向算力中心的多層次可再生能源供給。二是算電市場協(xié)同,解決綠電交易市場與算力低碳運營不相適應,推進電力市場體系建設,為算力提供可靠綠電來源和有效價格激勵,通過市場化機制實現(xiàn)綠電低成本供給。三是算電調度協(xié)同,解決新能源發(fā)電與算力用能的穩(wěn)定性不匹配,通過AI技術推動兩網(wǎng)間根據(jù)容量、季節(jié)等因素進行時間、空間匹配調度,通過聯(lián)合調度實現(xiàn)低碳電力最大化消納。歌、OpenAI等國外頭部企業(yè),引領MoE大模型落地,優(yōu)先推動MoE生態(tài)全面布局,力爭MoE發(fā)展領航者。OpenAI推出國際領先大模型用MoE升級多模態(tài)大模型M6,與同期GPMiniMax等國內外AI初創(chuàng)企業(yè),依托MoE大模型起家,利用其低成AI,通過開源全球首個MoE大模型Mistral8x7B,迅速提升品牌影其“天工2.0”已面向C端用戶免費開放。以“大模型+機器人”為特征的具身智能快速發(fā)展,推動人形機器人閉環(huán)自智。具身智能(EmbodiedIntelligence)是一種高級的機器智能形式,它使機器人能夠像人類一樣感知和理解環(huán)境,并通過自主學習和適應性行為來完成任務。隨著AI產(chǎn)業(yè)進程加速,大語言、視覺、多模態(tài)等大模型層出不窮,正加速與機器人技術相融合,與傳感器、控制器等機器人關鍵部件共同組成人形機器人“大腦+小腦”,從感知、認知、決策、規(guī)劃、控制、交互、學習、仿真等全方位提升機器人的智能化、通用化水平。由于機器人需通過傳感器感知外部世界,因此無法直接照搬大模型中的Transformer架構,目前主要以OpenAI為代表的分層決策模型和以GoogleRT-2為代表的端到端模型兩種算法路徑實現(xiàn)。OpenAI、亞馬遜、三星等多家巨頭投資的Figure01人形機器人基于大模型提供更高層級的視覺和語言智能,能流暢地與人交談、理解人類需求并完成具體行動;特斯拉Optimus人形機器人內置chatGPT能在實際生產(chǎn)環(huán)境中糾正自己的錯誤。大規(guī)模智算集群組網(wǎng)是AI大模型訓練效率提升的關鍵。在大模算網(wǎng)絡具備超大規(guī)模、超高帶寬、超低時延算時間/整體訓練時間),對于AI集群訓練效率的提升至關重業(yè)界加快研究支持大模型跨數(shù)據(jù)中心分布式訓練的長距組網(wǎng)技信優(yōu)化技術、800GC+L傳輸技術等關鍵技術。如谷歌基于自研AI芯片TPUv4(AI芯片)和光電路交換機,跨多個數(shù)據(jù)中心完成Gemini級GPU算力集群,以滿足GPT-6模型訓練需求。但由于電力受限,替換IB協(xié)議來實現(xiàn)跨區(qū)域GPU之間的互聯(lián)。中國電信基于國產(chǎn)化算力完成跨百公里千億參數(shù)模型在千卡規(guī)模下的分布式智算中心互聯(lián)現(xiàn)網(wǎng)驗證[23],訓練性能達到集中式單智算中心的95%以上,證明了該技術方向的可行性。阿里提出“雙上聯(lián)+雙平面+多軌”的網(wǎng)絡架構,單Pod規(guī)模達到15KGPU,不同P先進封裝技術協(xié)同創(chuàng)新,具備高性能、高能效圖17存儲計算“剪刀差”存算一體主要包括近存計算和存內計算兩種發(fā)展路線。以HBM用,如英偉達H200使用了HBM3e,顯存帶寬可達4.8TB/秒,并提供完成8nmeMRAM的技術開發(fā),國內清華大學基于ReRAM的存內計算大模型等AI應用為存算一體產(chǎn)業(yè)發(fā)展帶來新機遇。HBM憑借高帶寬、低能耗已成英偉達、AMD、華為的等企業(yè)主要供應商均表示,2024年訂單已售罄。存內計算技術,雖然目前仍處于早期發(fā)展階段,但發(fā)展?jié)摿薮?。后摩智能、D-matrix等國內2024年2月,諾基亞貝爾實驗室在巴黎進行了空芯光纖傳輸試驗測公司聯(lián)合Nokia、DigitalRealty等公司開展了空芯光纖實際線路環(huán)境中的現(xiàn)場傳輸試驗,在1.386公里的鏈路上,實現(xiàn)往返延遲降低30%。5月,中國聯(lián)通宣布攜手北理工、上海諾基亞貝爾及長飛突破單向超100Tbit/s空芯光纜傳輸系統(tǒng)現(xiàn)網(wǎng)示范工程[29]。作為一項顛電力資源,提升同一算力節(jié)點內源-網(wǎng)-荷-儲的高效協(xié)同和能源高效少用電量和熱能的浪費[30]。關鍵技術成熟度評估整體看,隨著AI產(chǎn)業(yè)快速發(fā)展,推動智算規(guī)模的快速擴張和GPU等基礎設施、服務應用3個一級指標,以及相應的8個二級指標。AI產(chǎn)業(yè)、智算中心、雙碳等相關智算政策,將影響智算中心選算力、數(shù)據(jù)互通的基礎,將影響智算對大模型等AI業(yè)務的訓練推理大模型數(shù)量、AI企業(yè)數(shù)量、AI發(fā)明專利數(shù)等是衡量每個區(qū)域AI2)指標賦值:基于省人民政府、工信部、國家統(tǒng)計局等官網(wǎng)統(tǒng)計三級指標對應的最新數(shù)據(jù),為三級指標賦值提供權威、客3)權重確定:基于AHP和熵權法主客觀結合為各指詳細的評估流程,見附錄計方案,其中一二級指標采用AHP方法確定權重,三級指標4)評估指數(shù)結果:最終根據(jù)指標的得分和權重得到各省相應的評估結果,包括綜合評估指數(shù)、外部環(huán)境評估指數(shù)、基礎設型等AI業(yè)務快速發(fā)展。京津冀基礎設施能力處于中上游水平,山東躋身第一梯隊。西部地區(qū)點發(fā)力。),環(huán)境、基礎設施、服務應用的能力分析。如求等多項新挑戰(zhàn)。與此同時,美國實施了更加嚴格的算力體系提供一站式大模型服務,助力AI快速創(chuàng)新,新一代智算液冷DC艙,實現(xiàn)了數(shù)據(jù)中心的能效和智算集群的算效雙機房開展了千億參數(shù)、千卡規(guī)模120km兩點拉遠驗證,探索長距鏈智算中心無損網(wǎng)絡測試驗證及相關創(chuàng)新研究將助力多方小規(guī)模智算中國電信中部智算中心位于湖北武漢東湖新技術開發(fā)區(qū)光谷八路中部智算中心(武昌)園區(qū),園區(qū)占地85畝,是工業(yè)互聯(lián)網(wǎng)標識解析國家頂級節(jié)點部署地、國家級互聯(lián)網(wǎng)骨干直聯(lián)點。2024年1月預留管路接口,兼容8-50kw冷量需求;匹配不同行業(yè)客戶需求,制了服務器等IT設備的可靠性。這一技術優(yōu)勢顯新能源使用率可達80%以上,形成綠電消納、產(chǎn)業(yè)協(xié)同、共建共維、2024年4月,海蘭云與合作伙伴共同發(fā)布全球首個海底智算中心平單艙可提供1400PFlops算力,算力效率提升40%。此外,長三角海年內即將動工。該項目將打造綠電直供、算待完善、規(guī)?;枨髸何达@現(xiàn)、核心技術有待對應的指標說明、評估單位,便于后續(xù)指標評估。附表1.中國智算發(fā)展?jié)摿υu估指標體系評估指標的最新數(shù)據(jù),為31省的三級指標賦值提供權威、客觀的依據(jù)。為31省的24個指標賦值,并對所有指標數(shù)值x進行歸一化處理,得到每個指標的標準化數(shù)值x'。附表2.智算發(fā)展?jié)摿υu估指標評判矩陣模板a11a12a1na21a22a2nan1an2ann要程度,例如,a是第i個指標與第j個指標比較對智算發(fā)展重要程A1,A2,A3,…,Am?;谌壷笜藢?1省數(shù)據(jù),采用熵權法確定三級指標b11b12b1,24b21b22b2,24b24,1b24,2b24,242)對矩陣B數(shù)據(jù)進行標準化處理,對于正向指標根據(jù)矩陣B標準化后的數(shù)值計算信息熵:備注:信息熵是對一個信源所含信息的度量,即信息量的期望。[1]EPOCHAI./data/notable-ai-models.2024[2]IDC.《2024AIGC應用層十大趨勢白皮書》.2024[3]Dealroom,FlowPartners.《TheMag
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年心理測試變態(tài)考試題庫及答案參考
- 2026年廣東食品藥品職業(yè)學院單招綜合素質考試題庫及答案1套
- 2026年寧德職業(yè)技術學院單招職業(yè)傾向性測試題庫及答案1套
- 2026年建筑電工期末試題及答案(名校卷)
- 2026年河南科技職業(yè)大學單招職業(yè)適應性測試模擬測試卷附答案
- 2026年朔州陶瓷職業(yè)技術學院單招職業(yè)傾向性考試題庫及答案1套
- 2026云南文山州馬關縣中醫(yī)醫(yī)院面向社會招聘2名編外中藥學專業(yè)技術人員筆試備考題庫及答案解析
- 2026年山東省臨沂市單招職業(yè)適應性測試模擬測試卷及答案1套
- 2025年合肥產(chǎn)投康養(yǎng)集團有限公司及子公司社會招聘17名考試備考題庫附答案
- 2025年中國廣電甘肅網(wǎng)絡股份有限公司臨夏州分公司招聘筆試備考題庫附答案
- T/CECS 10310-2023水性聚氨酯防水涂料
- T/CCT 007-2024煤化工廢水處理運營能力評價
- GB/T 45554-2025種豬生產(chǎn)性能測定技術規(guī)范
- 食品居間合同協(xié)議
- 2022學年上海復旦附中高一(上)期末信息技術試題及答案
- 廣東省廣州市白云區(qū)2024-2025學年六年級(上)期末語文試卷(有答案)
- 心內科護理帶教工作總結
- 知行合一實踐出真知主題班會
- GB/T 45166-2024無損檢測紅外熱成像檢測總則
- 山東省菏澤市東明縣2024-2025學年七年級上學期考試生物試題
- 北京市海淀區(qū)2023-2024學年六年級上學期語文期末試卷(含答案)
評論
0/150
提交評論