共封裝光學(xué)器件（CPO）手冊(cè)-以光為介質(zhì)實(shí)現(xiàn)下一代互連技術(shù)擴(kuò)展

上傳人：加*** IP屬地：北京上傳時(shí)間：2026-01-24 格式：DOCX 頁(yè)數(shù)：114 大小：5.37MB 積分：12 舉報(bào) 版權(quán)申訴

共封裝光學(xué)器件（CPO）手冊(cè)-以光為介質(zhì)實(shí)現(xiàn)下一代互連技術(shù)擴(kuò)展_第2頁(yè)

共封裝光學(xué)器件（CPO）手冊(cè)-以光為介質(zhì)實(shí)現(xiàn)下一代互連技術(shù)擴(kuò)展_第3頁(yè)

共封裝光學(xué)器件（CPO）手冊(cè)-以光為介質(zhì)實(shí)現(xiàn)下一代互連技術(shù)擴(kuò)展_第4頁(yè)

共封裝光學(xué)器件（CPO）手冊(cè)-以光為介質(zhì)實(shí)現(xiàn)下一代互連技術(shù)擴(kuò)展_第5頁(yè)

已閱讀5頁(yè)，還剩109頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

橫向擴(kuò)展與縱向擴(kuò)展的CPO技術(shù)、CPO總擁有成本與功耗預(yù)算、DSP收發(fā)器與LPO/NPO/CPO對(duì)比、臺(tái)積電COUPE工藝、MZM/MRM/EAM調(diào)制器深度解析、CPO核心企業(yè)與供應(yīng)鏈布局7共封裝光器件（CPO）技術(shù)長(zhǎng)期以來(lái)被寄予厚望，有望徹底改變數(shù)據(jù)中心互聯(lián)格局，但該技術(shù)歷經(jīng)漫長(zhǎng)周期才得以面世，真正具備部署條件的成熟產(chǎn)品直至2025年才問(wèn)世。在此期間，可插拔收發(fā)器憑借其相對(duì)成本效益、部署便捷性以及基于標(biāo)準(zhǔn)的互操作性，始終滿足網(wǎng)絡(luò)需求并保持著主流地位。然而，人工智能工作負(fù)載帶來(lái)的高網(wǎng)絡(luò)需求意味著此次情況不同。人工智能網(wǎng)絡(luò)帶寬的發(fā)展路線圖表明，互連速度、覆蓋范圍、密度和可靠性要求很快將超越收發(fā)器所能提供的水平。固態(tài)光子學(xué)(CPO）將帶來(lái)一定效益，為橫向擴(kuò)展網(wǎng)絡(luò)提供更多選擇，但它將成為縱向擴(kuò)展網(wǎng)絡(luò)的核心技術(shù)。在本十年后期及之后，CPO將成為縱向擴(kuò)展網(wǎng)絡(luò)帶寬增長(zhǎng)的主要驅(qū)動(dòng)力。當(dāng)前基于銅纜的擴(kuò)展解決方案（如NVLink）可提供高達(dá)7.2Tbit/s的單GPU帶寬——魯賓架構(gòu)時(shí)代將提升至14.4Tbit/s。然而銅纜鏈路的傳輸距離上限僅為兩米，這意味著擴(kuò)展域的規(guī)模最多只能覆蓋一兩個(gè)機(jī)架。此外，通過(guò)銅纜提升帶寬的難度正日益增加。在Rubin架構(gòu)中，NVIDIA將通過(guò)雙向SerDes技術(shù)使每銅纜通道帶寬再翻倍。但依靠開(kāi)發(fā)更高速SerDes來(lái)提升銅纜帶寬的擴(kuò)容路徑充滿挑戰(zhàn)，進(jìn)展緩慢。而CPO技術(shù)不僅能實(shí)現(xiàn)同等甚至更優(yōu)的帶寬密度，更能提供多元化的帶寬擴(kuò)容路徑，同時(shí)支持更大規(guī)模的擴(kuò)展域。要理解CPO技術(shù)誕生的動(dòng)因，首先需審視光通信中使用收發(fā)器時(shí)存在的諸多低效與權(quán)衡。收發(fā)器雖能延長(zhǎng)鏈路距離，但網(wǎng)絡(luò)交換機(jī)或計(jì)算托盤前面板上用于插拔收發(fā)器的插槽，通常距離XPU或交換機(jī)ASIC有15-30厘米之遙。這意味著信號(hào)必須先通過(guò)LR串解碼器在15-30厘米距離內(nèi)進(jìn)行電傳輸，再由收發(fā)器內(nèi)的數(shù)字信號(hào)處理器（DSP）恢復(fù)并調(diào)理電信號(hào)，最后轉(zhuǎn)換為光信號(hào)。采用CPO方案時(shí)，光引擎直接部署于XPU或交換機(jī)ASIC旁，從而省去DSP環(huán)節(jié)，并可使用低功耗SerDes將數(shù)據(jù)從XPU傳輸至光引擎。相較于DSP收發(fā)器，該方案可降低50%以上的數(shù)據(jù)傳輸能耗——許多方案甚至致力于將每比特能耗降低80%。來(lái)源：SemiAnalysis盡管像英偉達(dá)和博通這樣的橫向擴(kuò)展型CPO解決方案正獲得更多關(guān)注，并受到終端客戶的密切關(guān)注,但主要超大規(guī)模企業(yè)已開(kāi)始規(guī)劃其縱向擴(kuò)展型CPO戰(zhàn)略，并向供應(yīng)商作出承諾。例如CelestialAI預(yù)計(jì)到2028年底可實(shí)現(xiàn)10億美元營(yíng)收規(guī)模——我們認(rèn)為這主要得益于其與亞馬遜Trainium4協(xié)同推出的縱向擴(kuò)展CPO解決方案。專注于CPO的企業(yè)現(xiàn)已超越論文、試點(diǎn)項(xiàng)目和演示階段，正就光端口架構(gòu)等關(guān)鍵產(chǎn)品決策展開(kāi)布局,以解決大規(guī)模量產(chǎn)難題。對(duì)于擴(kuò)展型CPO而言，問(wèn)題已不再是"是否采用"和"為何采用"，而是"何時(shí)實(shí)現(xiàn)"和"如何推進(jìn)"——如何推動(dòng)這些系統(tǒng)進(jìn)入量產(chǎn)階段，以及何時(shí)能確保激光器等關(guān)鍵組件的供應(yīng)鏈穩(wěn)定。制造商能夠擴(kuò)大足夠的生產(chǎn)規(guī)模。本文將深入探討CPO的優(yōu)勢(shì)與挑戰(zhàn)、CPO架構(gòu)的工作原理、當(dāng)前及未來(lái)的CPO產(chǎn)品、專注于CPO的企業(yè)、CPO相關(guān)組件及其各自的供應(yīng)鏈。本文旨在為從業(yè)者、行業(yè)分析師、投資者以及所有對(duì)互連技術(shù)感興趣的人士提供指南。目錄與閱讀指南本文分為五個(gè)部分——讀者可根據(jù)自身興趣或關(guān)聯(lián)度選擇重點(diǎn)閱讀章節(jié)。在第一部分：CPO總擁有成本（TCO）分析中，我們將首先探討采用CPO如何改變橫向擴(kuò)展與縱向擴(kuò)展網(wǎng)絡(luò)的總擁有成本。我們認(rèn)為，在橫向擴(kuò)展網(wǎng)絡(luò)中采用CPO時(shí)，總擁有成本、可靠性及設(shè)備供應(yīng)商議價(jià)能力將是主要考量因素。我們將探討CPO技術(shù)是否已具備在橫向擴(kuò)展場(chǎng)景中的成熟應(yīng)用條件，并結(jié)合現(xiàn)有解決方案可靠性數(shù)據(jù)進(jìn)行論證，例如Meta公司在ECOC2025大會(huì)上發(fā)布的CPO橫向擴(kuò)展交換機(jī)研究成果。在第二部分：CPO介紹與實(shí)施中，我們將深入探討CPO的工作原理。本節(jié)將探討市場(chǎng)從銅纜到共封裝銅纜的演進(jìn)歷程，從數(shù)字信號(hào)處理器（DSP）光模塊到線性可插拔光模塊（LPO）再到CPO的發(fā)展軌跡，并剖析推動(dòng)CPO應(yīng)用的驅(qū)動(dòng)力與核心論據(jù)。同時(shí)將深入分析串行器/解串器（SerDes）的擴(kuò)展極限，以及寬帶I/O作為SerDes替代方案的潛力——尤其當(dāng)其與CPO協(xié)同應(yīng)用時(shí)所展現(xiàn)的優(yōu)勢(shì)。在第三部分：推動(dòng)CPO進(jìn)入市場(chǎng)中，我們將闡述助力CPO獲得市場(chǎng)認(rèn)可并實(shí)現(xiàn)商業(yè)化的關(guān)鍵技術(shù)。首先探討主機(jī)與光引擎封裝技術(shù)，詳細(xì)解析臺(tái)積電COUPE工藝及其成為首選集成方案的原因。光纖連接單元（FAU）、光纖耦合技術(shù)以及邊緣耦合器與光柵耦合器的對(duì)比將得到全面闡述。我們將涵蓋調(diào)制器類型，包括馬赫-曾德?tīng)栒{(diào)制器（MZM）、微環(huán)調(diào)制器（MRM）和電吸收調(diào)制器（EAM）。本節(jié)將以闡釋光纖光子學(xué)被廣泛采用的核心原因收尾——即通過(guò)光纖光子學(xué)實(shí)現(xiàn)帶寬擴(kuò)展的多重路徑：增加光纖連接數(shù)量、采用波分復(fù)用技術(shù)波分復(fù)用（WDM）和高階調(diào)制。更多一手外資研報(bào)請(qǐng)加微信：FCCNN88在第四部分：當(dāng)前與未來(lái)的CPO產(chǎn)品中，我們將分析現(xiàn)今市場(chǎng)上可用的CPO產(chǎn)品及其相關(guān)供應(yīng)鏈。我們將從英偉達(dá)和博通的解決方案開(kāi)始，隨后探討主要CPO企業(yè)。我們將深入剖析AyarLabs、Nubis、CelestialAI、Lightmatter、XscapePhotonics、Ranovus及Scintil等企業(yè)的解決方案，詳細(xì)闡述各供應(yīng)商的技術(shù)方案，并針對(duì)每家公司的技術(shù)路線進(jìn)行利弊權(quán)衡。最后，在第五部分：英偉達(dá)CPO供應(yīng)鏈中，我們將詳細(xì)描述英偉達(dá)CPO生態(tài)系統(tǒng)的供應(yīng)鏈，列出激光光源、ELS模塊、光纖接頭（FAU）、FAU點(diǎn)燈工具、FAU組裝、切換盒、MPO連接器、MT插芯、光纖以及電光測(cè)試等關(guān)鍵供應(yīng)商，以此為本報(bào)告作結(jié)。今年早些時(shí)候NVIDIAGTC2025大會(huì)上最受矚目的議題之一，是詹森宣布推出公司首款支持CPO技術(shù)的橫向擴(kuò)展網(wǎng)絡(luò)交換機(jī)。值得注意的是，在縱向擴(kuò)展領(lǐng)域，英偉達(dá)仍堅(jiān)持推進(jìn)銅纜技術(shù)，并竭力避免轉(zhuǎn)向光纖方案——這一策略將持續(xù)至2027年乃至2028年。讓我們從探討這些新型CPO交換機(jī)的總體擁有成本入手，分析橫向擴(kuò)展型CPO技術(shù)能帶來(lái)的成本與能耗節(jié)約效益。英偉達(dá)在GTC2025主題演講中發(fā)布了三款采用不同CPO交換機(jī)ASIC的橫向擴(kuò)展交換機(jī)。盡管其具備TCO、功耗和部署速度優(yōu)勢(shì)，但這些優(yōu)勢(shì)尚不足以促使客戶立即轉(zhuǎn)向全新的部署模式，因此我們預(yù)計(jì)首批CPO橫向擴(kuò)展交換機(jī)的采用率將較為有限。具體原因如下：來(lái)源：SemiAnalysis典型的AI集群包含三種主要網(wǎng)絡(luò)架構(gòu)：后端架構(gòu)、前端架構(gòu)和帶外管理架構(gòu)。其中使用最頻繁且技術(shù)要求最高的當(dāng)屬后端架構(gòu)。該架構(gòu)用于GPU之間的橫向擴(kuò)展通信，支持GPU在集體操作中相互通信并交換數(shù)據(jù)，從而實(shí)現(xiàn)訓(xùn)練與推理的并行化處理。后端網(wǎng)絡(luò)通常采用InfiniBand或以太網(wǎng)協(xié)議。由于其高要求特性，后端網(wǎng)絡(luò)在總網(wǎng)絡(luò)成本和功耗中占據(jù)主導(dǎo)地位：在采用英偉達(dá)X800-Q3400后端交換機(jī)部署于InfiniBand的3層GB300NVL72集群中，其網(wǎng)絡(luò)成本占比達(dá)85%，網(wǎng)絡(luò)功耗占比達(dá)86%?；贑PO的交換機(jī)和網(wǎng)絡(luò)解決方案可同時(shí)應(yīng)用于后端與前端網(wǎng)絡(luò)，但我們認(rèn)為當(dāng)前階段的部署重點(diǎn)仍應(yīng)放在后端網(wǎng)絡(luò)。讀者可查閱更多關(guān)于后端網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、端口配置、交換機(jī)及收發(fā)器等詳細(xì)信息。信g息收錄中均有提及信g息收錄中均有提及模型。若需了解網(wǎng)絡(luò)總擁有成本，可參閱我們的《AINeocloud解剖與實(shí)踐指南》文章。縮小范圍來(lái)看——網(wǎng)絡(luò)成本是AI集群總成本中僅次于AI服務(wù)器本身的第二大組成部分。在采用GB300NVL72集群搭配三層InfiniBand網(wǎng)絡(luò)的配置中，網(wǎng)絡(luò)成本占集群總成本的15%；若升級(jí)為四層網(wǎng)絡(luò)，該比例將升至18%。光收發(fā)器是該成本的重要組成部分，在采用相對(duì)昂貴的NvidiaLinkX收發(fā)器的三層網(wǎng)絡(luò)中，其成本占比高達(dá)網(wǎng)絡(luò)總成本的60%。同時(shí)，三層網(wǎng)絡(luò)中光收發(fā)器消耗的功耗占網(wǎng)絡(luò)總功耗的45%。人工智能集群中的GPU數(shù)量越多，就越可能需要增加網(wǎng)絡(luò)層數(shù)。從兩層網(wǎng)絡(luò)擴(kuò)展到三層及以上網(wǎng)絡(luò),意味著更高的成本和更大的功耗預(yù)算。CPO技術(shù)既能在保持層數(shù)不變的情況下降低功耗和成本,又能通過(guò)在固定層數(shù)的網(wǎng)絡(luò)中擴(kuò)展可連接的GPU數(shù)量，從而減少總功耗和成本需求。今年早些時(shí)候，在GTC2025大會(huì)上，英偉達(dá)首席執(zhí)行官黃仁勛強(qiáng)調(diào)，僅收發(fā)器本身就消耗了巨大功耗,這是推動(dòng)CPO技術(shù)發(fā)展的關(guān)鍵驅(qū)動(dòng)力。根據(jù)上表中的機(jī)架功耗預(yù)算數(shù)據(jù)，在三層網(wǎng)絡(luò)架構(gòu)下，一個(gè)由20萬(wàn)個(gè)GB300NVL72（每機(jī)架含72個(gè)GPU封裝和144個(gè)計(jì)算芯片）組成的GPU集群將消耗435兆瓦關(guān)鍵IT功耗，其中光收發(fā)器單項(xiàng)功耗就高達(dá)17兆瓦。顯然，通過(guò)大幅減少收發(fā)器數(shù)量可節(jié)省海量能耗。通過(guò)對(duì)比單個(gè)800GDSP收發(fā)器的功耗與CPO系統(tǒng)中光引擎及激光源（按800G帶寬計(jì)算）的功耗即可輕松驗(yàn)證：800GDR4光收發(fā)器功耗約為16-17瓦，而我們估算NvidiaQ3450CPO交換機(jī)中光引擎與外部激光源的功耗僅為每800G帶寬4-5瓦，實(shí)現(xiàn)73%的能耗降低。這些數(shù)據(jù)與Meta在ECOC2025會(huì)議上發(fā)表的論文中所呈現(xiàn)的數(shù)據(jù)非常接近。在本報(bào)告中，Meta展示了800G2xFR4可插拔收發(fā)器功耗約為15W，而博通Bailly51.2TCPO交換機(jī)內(nèi)部的光引擎和激光源在傳輸每800G帶寬時(shí)功耗僅約5.4W，實(shí)現(xiàn)了65%的節(jié)能效果。來(lái)源：Meta讓我們將分析擴(kuò)展到集群層面。以基于三層網(wǎng)絡(luò)構(gòu)建的GB300NVL72集群為例，可見(jiàn)將后端網(wǎng)絡(luò)中的DSP收發(fā)器替換為L(zhǎng)PO收發(fā)器后，可降低36%的總收發(fā)器功耗和16%的總網(wǎng)絡(luò)功耗。若全面過(guò)渡至CPO技術(shù)，相較于DSP光模塊可實(shí)現(xiàn)更顯著的節(jié)能效果——收發(fā)器功耗降低84%——但部分節(jié)能效益會(huì)被新增的光學(xué)引擎（OEs）和外部光源（ELSs）所抵消。交換機(jī)，其總功耗現(xiàn)已增加23%。在下例中，CPO場(chǎng)景下的光收發(fā)器功耗仍維持在每臺(tái)服務(wù)器1000W的基準(zhǔn)值，因?yàn)槲覀兗僭O(shè)前端網(wǎng)絡(luò)仍將采用DSP收發(fā)器。采用英偉達(dá)的CPO橫向擴(kuò)展交換機(jī)意味著默認(rèn)使用高基數(shù)網(wǎng)絡(luò)，盡管這種機(jī)制對(duì)終端用戶而言是"抽象化"的——因?yàn)樵贑PO交換機(jī)內(nèi)部即可完成端口切換，而使用高基數(shù)非CPO交換機(jī)時(shí)則需通過(guò)配線架或八爪魚線纜在交換機(jī)外部進(jìn)行切換。相反，這些NVIDIACPO交換機(jī)呈現(xiàn)出極高的端口數(shù)量——例如Quantum3450提供144個(gè)800G端口，Spectrum6800則提供512個(gè)800G端口。我們使用"默認(rèn)"一詞是因?yàn)橛ミ_(dá)的非CPOInfiniBandQuantumQ3400交換機(jī)同樣提供144個(gè)800G端口，但其其他InfiniBand交換機(jī)（如QM9700）僅提供32個(gè)800G端口——唯有前者具備這種"高基數(shù)集成"特性，能提供大量有效端口。如此高的端口密度有望幫助客戶將三層網(wǎng)絡(luò)扁平化為兩層網(wǎng)絡(luò)，同時(shí)省去部署交換盒、配線架或笨重八爪魚線纜的麻煩，這將成為關(guān)鍵賣點(diǎn)。在兩層網(wǎng)絡(luò)架構(gòu)下，相較傳統(tǒng)DSP收發(fā)器，收發(fā)器功耗降低84%，交換機(jī)功耗下降21%，整體網(wǎng)絡(luò)功耗可減少48%。Spectrum6800交換機(jī)憑借其在兩種可用邏輯配置下均具備的大量端口——512個(gè)800G端口——相較于Spectrum6810（提供128個(gè)800G端口、256個(gè)400G端口或512個(gè)200G端口）實(shí)現(xiàn)了這一特性。采用Spectrum6810的128個(gè)800G端口方案時(shí)，兩層網(wǎng)絡(luò)最多可連接8,192個(gè)GPU；而Spectrum6800在512個(gè)800G端口配置下，可連接131,072個(gè)GPU。順帶一提，使用交換機(jī)L層網(wǎng)絡(luò)中其魔力在于端口數(shù)量k會(huì)隨層數(shù)呈指數(shù)級(jí)增長(zhǎng)。因此，對(duì)于雙層網(wǎng)絡(luò)，通過(guò)將每個(gè)端口的帶寬減半(例如將800G端口切分為兩個(gè)400G端口）來(lái)實(shí)現(xiàn)邏輯端口數(shù)量翻倍——無(wú)論是采用內(nèi)部切換（如Spectrum6800所示）、分支電纜還是雙端口收發(fā)器——所支持的主機(jī)數(shù)量將增加四倍！本節(jié)討論的節(jié)能效果——三層CPO網(wǎng)絡(luò)節(jié)省23%，降至兩層CPO網(wǎng)絡(luò)可節(jié)省48%——看似驚人，但關(guān)鍵在于：三層網(wǎng)絡(luò)中，網(wǎng)絡(luò)功耗僅占集群總功耗的9%。因此，對(duì)于橫向擴(kuò)展網(wǎng)絡(luò)而言，轉(zhuǎn)向CPO技術(shù)帶來(lái)的實(shí)際效益最終會(huì)被大幅稀釋。三層網(wǎng)絡(luò)采用CPO可降低23%的網(wǎng)絡(luò)功耗，但僅帶來(lái)2%的集群總功耗節(jié)??；而兩層網(wǎng)絡(luò)雖能降低48%的網(wǎng)絡(luò)功耗，集群總功耗節(jié)省卻僅為4%。觀察集群總資本成本時(shí)，情況類似。讓我們簡(jiǎn)要聚焦于收發(fā)器與CPO解決方案的成本細(xì)節(jié)對(duì)比。首款NvidiaCPO交換機(jī)——QuantumX800-Q3450CPO將采用72個(gè)光引擎，每個(gè)運(yùn)行速率為1.6Tbit/s；后續(xù)版本的QuantumCPO交換機(jī)預(yù)計(jì)將升級(jí)為36個(gè)光引擎，每個(gè)引擎速率達(dá)3.2Tbit/s，單價(jià)約1000美元（含F(xiàn)AU這意味著每套系統(tǒng)光引擎總成本高達(dá)3.6萬(wàn)美元。為便于比較，不妨估算采用傳統(tǒng)光收發(fā)器模塊的總成本：非CPO版本的X800-Q3400配備72個(gè)OSFP插槽,并通過(guò)采用1.6T雙端口收發(fā)器實(shí)現(xiàn)144個(gè)800G端口。假設(shè)成本為通用型1.6TDR8收發(fā)器單價(jià)1,000美元，該交換機(jī)所需收發(fā)器總成本將達(dá)72,000美元，是實(shí)現(xiàn)同等帶寬的CPO交換機(jī)所需光引擎和ELS組件預(yù)估成本（35,000-40,000美元）的兩倍。但此計(jì)算未計(jì)入交換機(jī)供應(yīng)商的利潤(rùn)空間。若按60%毛利率計(jì)算，最終用戶的光引擎成本將升至8萬(wàn)至9萬(wàn)美元——高于同等收發(fā)器的成本。此外，光纖切換器等其他組件同樣會(huì)疊加此類利潤(rùn)層級(jí)。這解釋了為何根據(jù)收發(fā)器采購(gòu)成本及交換機(jī)廠商利潤(rùn)率的不同，遷移至CPO方案的成本節(jié)約可能并不顯著。如下表所示，在三層網(wǎng)絡(luò)中將收發(fā)器替換為CPO時(shí)，CPO組件的額外利潤(rùn)導(dǎo)致交換成本增加81%，這抵消了因不采購(gòu)收發(fā)器而節(jié)省的86%成本。盡管CPO方案的總網(wǎng)絡(luò)成本仍比DSP收發(fā)器方案低31%,但與電源成本類似的情況再次出現(xiàn)：由于服務(wù)器機(jī)架在集群總擁有成本中占據(jù)主導(dǎo)地位，導(dǎo)致集群總成本僅下降3%。將網(wǎng)絡(luò)從三層簡(jiǎn)化為兩層可實(shí)現(xiàn)更顯著的成本節(jié)約——集群總成本最高可降低7%，收發(fā)器成本下降86%，網(wǎng)絡(luò)總成本減少46%。那么——既然CPO方案一方面僅能帶來(lái)最高7%的成本節(jié)約和4%的功耗降低，另一方面卻引發(fā)了現(xiàn)場(chǎng)維護(hù)難度增加、可靠性與影響范圍的擔(dān)憂（無(wú)論是否合理以及失去多供應(yīng)商議價(jià)能力的顧慮，為何GPU云仍選擇采用它？簡(jiǎn)而言之，該技術(shù)尚未廣泛普及——我們預(yù)計(jì)短期內(nèi)超大規(guī)模企業(yè)對(duì)橫向擴(kuò)展CPO系統(tǒng)的采用曲線不會(huì)陡峭。相反，我們認(rèn)為用于擴(kuò)展的CPO才是殺手級(jí)應(yīng)用。如前所述，主要超大規(guī)模供應(yīng)商已承諾在本十年末前部署基于CPO的擴(kuò)展解決方案。當(dāng)前，基于銅纜的現(xiàn)有擴(kuò)展范式正面臨極限挑戰(zhàn)：銅纜傳輸距離受限——單通道200Gbit/s速率下最長(zhǎng)僅能達(dá)到兩米，且單通道帶寬翻倍難度日益增加。光子芯片（CPO）可有效解決這些問(wèn)題，它不僅能滿足帶寬密度要求，更能提供多重?cái)U(kuò)展路徑以支撐未來(lái)帶寬需求，同時(shí)將系統(tǒng)規(guī)模擴(kuò)展至更廣闊的維度。一旦將CPO部署用于縱向擴(kuò)展網(wǎng)絡(luò)，縱向擴(kuò)展域?qū)⒉辉偈芑ミB距離的限制。原則上，客戶能夠?qū)⒖v向擴(kuò)展域擴(kuò)展至任意規(guī)模。當(dāng)然，若希望將縱向擴(kuò)展域維持在單層扇出網(wǎng)絡(luò)中以實(shí)現(xiàn)全互連，則其規(guī)模將受限于交換機(jī)的基數(shù)。規(guī)模擴(kuò)展型結(jié)構(gòu)的網(wǎng)絡(luò)要求遠(yuǎn)比后端橫向擴(kuò)展網(wǎng)絡(luò)更為嚴(yán)苛。GPU間或與交換機(jī)間的連接需要更高的帶寬和更低的延遲，以實(shí)現(xiàn)GPU的互聯(lián)互通，從而使其能夠協(xié)同共享內(nèi)存等資源。例如，NvidiaBlackwell平臺(tái)上的第五代NVLink可為每塊GPU提供900GB/s（7,200Gbit/s）的單向帶寬。這相當(dāng)于后端擴(kuò)展網(wǎng)絡(luò)中每GPU100GB/s（800Gbit/s）帶寬的9倍（以GB300NVL72搭配CX-8網(wǎng)卡為例）。這也催生了對(duì)更高岸線帶寬密度的需求帶寬密度，這正是推動(dòng)GPUSerDes線路速度發(fā)展的動(dòng)力。同樣重要的是要認(rèn)識(shí)到，隨著縱向擴(kuò)展領(lǐng)域的規(guī)模擴(kuò)大以及縱向擴(kuò)展互連速度的提升，縱向擴(kuò)展互連（最終包括縱向擴(kuò)展CPO）的總可尋址市場(chǎng)（TAM）已遠(yuǎn)超橫向擴(kuò)展網(wǎng)絡(luò)。CPO的TAM很可能由縱向擴(kuò)展而非橫向擴(kuò)展網(wǎng)絡(luò)應(yīng)用主導(dǎo)。來(lái)源：SemiAnalysis目前，擴(kuò)展型網(wǎng)絡(luò)完全采用銅纜運(yùn)行是有充分理由的。在現(xiàn)行可插拔架構(gòu)中，若要通過(guò)光收發(fā)器匹配NVLink帶寬，不僅成本和功耗將高得令人望而卻步，還會(huì)引入額外延遲。此外，計(jì)算托盤的面板空間可能根本不足以容納所有這些收發(fā)器。銅纜在實(shí)現(xiàn)低延遲、高吞吐量的連接方面表現(xiàn)卓越連接場(chǎng)景。然而如前所述，銅纜傳輸距離的局限性制約了"世界規(guī)模"——即單個(gè)擴(kuò)展域內(nèi)可連接的GPU數(shù)量上限。擴(kuò)大縱向擴(kuò)展世界規(guī)模是計(jì)算擴(kuò)展的關(guān)鍵路徑。在當(dāng)前基于推理的模型擴(kuò)展和測(cè)試時(shí)間計(jì)算體系下，單一縱向擴(kuò)展域內(nèi)增加更多計(jì)算能力、內(nèi)存容量及內(nèi)存帶寬已變得至關(guān)重要。英偉達(dá)的GB200系統(tǒng)實(shí)現(xiàn)了性能飛躍，其世界規(guī)模從僅8個(gè)互聯(lián)GPU擴(kuò)展至72個(gè)全互聯(lián)GPU，通過(guò)更復(fù)雜的集體通信技術(shù)實(shí)現(xiàn)了海量吞吐量提升——這些技術(shù)在規(guī)模擴(kuò)展網(wǎng)絡(luò)中難以實(shí)現(xiàn)。在銅纜架構(gòu)下，該方案僅能部署于單機(jī)架空間內(nèi)，對(duì)供電系統(tǒng)、熱管理及制造工藝提出嚴(yán)苛要求。該系統(tǒng)的復(fù)雜性至今仍令下游供應(yīng)鏈在產(chǎn)能爬坡方面舉步維艱。英偉達(dá)將繼續(xù)堅(jiān)持使用銅制材料。他們還需進(jìn)一步提升其縱向擴(kuò)展型系統(tǒng)規(guī)模，以保持對(duì)AMD等競(jìng)爭(zhēng)對(duì)手及正在追趕其縱向擴(kuò)展網(wǎng)絡(luò)的超大規(guī)模企業(yè)的領(lǐng)先優(yōu)勢(shì)。因此，英偉達(dá)被迫采取極端措施，在單個(gè)機(jī)架內(nèi)拓展縱向擴(kuò)展領(lǐng)域。在GTC2025大會(huì)上展示的Nvidia為RubinUltra設(shè)計(jì)的極端Kyber機(jī)架架構(gòu)，可擴(kuò)展至144個(gè)GPU封裝單元（576個(gè)GPU芯片）。該機(jī)架的密度是原本就極為密集的GB200/300NVL72機(jī)架的4倍。鑒于GB200在制造和部署方面已相當(dāng)復(fù)雜，Kyber架構(gòu)將這一復(fù)雜性提升到了全新高度。光學(xué)技術(shù)實(shí)現(xiàn)了相反的方案：通過(guò)跨多個(gè)機(jī)架擴(kuò)展來(lái)增大世界規(guī)模，而非在有限空間內(nèi)堆砌更多加速器——后者面臨供電和熱密度方面的挑戰(zhàn)。當(dāng)前可通過(guò)可插拔收發(fā)器實(shí)現(xiàn)此方案，但光收發(fā)器的成本及其高功耗特性仍使其難以普及。來(lái)源：SemiAnalysis在銅纜上擴(kuò)展帶寬也日益困難。通過(guò)Rubin芯片，英偉達(dá)采用創(chuàng)新的雙向SerDes技術(shù)實(shí)現(xiàn)了帶寬翻倍——該技術(shù)使發(fā)送和接收操作共享同一通道，從而實(shí)現(xiàn)每通道224Gbit/s發(fā)送+224Gbit/s接收的全雙工通信。要在銅纜上實(shí)現(xiàn)每通道"真正"的448Gbit/s仍是一項(xiàng)充滿挑戰(zhàn)的壯舉，其上市時(shí)間尚不確定。相比之下，CPO技術(shù)提供了多重帶寬擴(kuò)展路徑：波特率提升、DWDM技術(shù)、增加光纖對(duì)數(shù)以及調(diào)制方式革新——本文后續(xù)將對(duì)此進(jìn)行詳細(xì)探討。那么，既然CPO是解決方案，為什么英偉達(dá)最初只將其應(yīng)用于橫向擴(kuò)展交換機(jī)，而未用于RubinUltra？這要?dú)w因于供應(yīng)鏈不成熟、制造挑戰(zhàn)以及客戶在部署方面的猶豫。Quantum和SpectrumCPO交換機(jī)的推出，旨在加速供應(yīng)鏈建設(shè)，并獲取更多關(guān)于數(shù)據(jù)中心可靠性和可維護(hù)性的實(shí)際應(yīng)用數(shù)據(jù)。在此期間，Meta在歐洲光通信大會(huì)（ECOC）期間發(fā)布的CPO可靠性數(shù)據(jù)提供了一些有價(jià)值的信息。Meta與博通合作開(kāi)展了這項(xiàng)研究，博通也發(fā)布了若干實(shí)用幻燈片。該研究中，Meta在15臺(tái)Bailly51.2TCPO交換機(jī)上進(jìn)行了規(guī)?？捎^的測(cè)試,累計(jì)運(yùn)行達(dá)1,049k個(gè)400G端口設(shè)備小時(shí)，并公布了最大非零KP4前向糾錯(cuò)（FEC）分桶值：來(lái)源：Meta論文同時(shí)說(shuō)明測(cè)試期間鏈路未出現(xiàn)故障或不可糾錯(cuò)碼字（UCW僅在總計(jì)104.9萬(wàn)400G端口設(shè)備小時(shí)的測(cè)試周期中觀察到一次FEC分箱值>10的情況。但Meta并未止步于此。在ECOC會(huì)議上發(fā)表該論文時(shí)，他們展示了擴(kuò)展至1500萬(wàn)400G端口設(shè)備小時(shí)的測(cè)試結(jié)果。新數(shù)據(jù)表明：前400萬(wàn)設(shè)備小時(shí)內(nèi)未出現(xiàn)UCW；400G2xFR4收發(fā)器平均故障間隔時(shí)間(MTBF)為0.5-100萬(wàn)設(shè)備小時(shí)（全球2xFR4平均值為55萬(wàn)而CPO的MTBF達(dá)260萬(wàn)設(shè)備小時(shí)。來(lái)源：Meta雖然1500萬(wàn)端口設(shè)備小時(shí)看似是個(gè)大數(shù)目，但這是以400G端口小時(shí)為單位計(jì)算的。因此——一臺(tái)51.2T交換機(jī)運(yùn)行一小時(shí)相當(dāng)于128個(gè)400G端口小時(shí)。15臺(tái)51.2T交換機(jī)累計(jì)1500萬(wàn)400G端口小時(shí)，相當(dāng)于7812個(gè)墻鐘小時(shí)，約合325天。事實(shí)上，這個(gè)1500萬(wàn)小時(shí)的數(shù)據(jù)常被簡(jiǎn)化為"小時(shí)"或"設(shè)備小時(shí)",省略了"端口"的限定。盡管在400萬(wàn)端口設(shè)備小時(shí)內(nèi)實(shí)現(xiàn)零故障和零UCW的統(tǒng)計(jì)數(shù)據(jù)極具參考價(jià)值——但在行業(yè)轉(zhuǎn)向CPO橫向擴(kuò)展交換技術(shù)并投入數(shù)十億美元前，僅憑15臺(tái)CPO交換機(jī)在實(shí)驗(yàn)室環(huán)境下測(cè)試11個(gè)月的數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠。在動(dòng)態(tài)現(xiàn)場(chǎng)環(huán)境中運(yùn)行數(shù)千臺(tái)橫向擴(kuò)展交換機(jī)是完全不同的挑戰(zhàn)，這些交換機(jī)在生產(chǎn)環(huán)境中的表現(xiàn)仍有待觀察。生產(chǎn)環(huán)境的溫度波動(dòng)可能遠(yuǎn)高于實(shí)驗(yàn)室環(huán)境，導(dǎo)致組件性能或耐用性出現(xiàn)意外變化。Meta在Llama3論文中指出，數(shù)據(jù)中心1-2%的溫度波動(dòng)就足以引發(fā)功耗異?！祟惒▌?dòng)是否會(huì)以難以預(yù)料的方式影響整個(gè)網(wǎng)絡(luò)架構(gòu)？Meta即便看似尋常的問(wèn)題——例如數(shù)據(jù)中心內(nèi)的灰塵——也令技術(shù)支持人員頭疼不已，他們可能耗費(fèi)大量時(shí)間清理光纖端口。當(dāng)然，CPO交換機(jī)采用LC或MPO類型的前插式連接器，但CPO交換機(jī)機(jī)箱內(nèi)部的灰塵問(wèn)題又該如何解決？0.06%的不可修復(fù)故障率看似誘人，但此類故障的波及范圍可達(dá)64個(gè)800G端口。本文雖聚焦于基于FR光學(xué)的CPO交換機(jī)，但下一代CPO交換機(jī)將采用DR光學(xué)技術(shù)。這些僅是已知的未知因素，實(shí)際部署中可能還會(huì)出現(xiàn)更多未知的未知問(wèn)題。事實(shí)上，這些成果通過(guò)提供切實(shí)可靠的數(shù)據(jù)，在說(shuō)服業(yè)內(nèi)人士方面產(chǎn)生了深遠(yuǎn)影響。我們的目的并非制造恐懼、不確定性或懷疑（FUD而是呼吁開(kāi)展更大規(guī)模的現(xiàn)場(chǎng)測(cè)試，使行業(yè)能夠快速識(shí)別并解決突發(fā)問(wèn)題，從而為CPO技術(shù)的廣泛應(yīng)用鋪平道路——尤其是在擴(kuò)展型網(wǎng)絡(luò)領(lǐng)域。歸根結(jié)底，英偉達(dá)此次推出的橫向擴(kuò)展型CPO產(chǎn)品，實(shí)為大規(guī)模部署前的預(yù)演與試探。我們認(rèn)為縱向擴(kuò)展架構(gòu)的部署規(guī)模與影響力將遠(yuǎn)超橫向擴(kuò)展，因?yàn)榭v向擴(kuò)展在總擁有成本（TCO）及性能/TCO效益方面具有更顯著的優(yōu)勢(shì)。此外，在橫向擴(kuò)展型CPO領(lǐng)域，RubinUltra計(jì)劃于2027年推出（我們認(rèn)為實(shí)際可能延遲至2027年底),而供應(yīng)鏈尚無(wú)法準(zhǔn)備好向GPU需求市場(chǎng)交付數(shù)千萬(wàn)臺(tái)CPO終端設(shè)備。即便如此，這個(gè)時(shí)間表對(duì)英偉達(dá)而言仍過(guò)于雄心勃勃。正因如此，費(fèi)曼架構(gòu)世代似乎將成為CPO技術(shù)注入英偉達(dá)生態(tài)系統(tǒng)的核心節(jié)點(diǎn)?，F(xiàn)在讓我們深入探討CPO的核心理念、技術(shù)考量、面臨的挑戰(zhàn)以及當(dāng)前生態(tài)系統(tǒng)的現(xiàn)狀。CPO技術(shù)將光引擎直接集成于高性能計(jì)算或網(wǎng)絡(luò)專用集成電路（ASIC）的同一封裝或模塊內(nèi)。這些光引擎負(fù)責(zé)將電信號(hào)轉(zhuǎn)換為光信號(hào)，從而實(shí)現(xiàn)光鏈路上的高速數(shù)據(jù)傳輸。當(dāng)數(shù)據(jù)傳輸距離超過(guò)數(shù)米時(shí)，必須采用光鏈路進(jìn)行通信，因?yàn)殂~纜傳輸?shù)母咚匐娦盘?hào)無(wú)法跨越數(shù)米距離。如今，大多數(shù)電光轉(zhuǎn)換都是通過(guò)可插拔光收發(fā)器實(shí)現(xiàn)的。在這種情況下，電信號(hào)會(huì)從開(kāi)關(guān)或處理芯片出發(fā)，穿越數(shù)十厘米甚至更長(zhǎng)的PCB電路板，最終抵達(dá)機(jī)箱前面板或后面板上的物理收發(fā)器插槽。可插拔光收發(fā)器就安裝在該插槽內(nèi)。收發(fā)器接收電信號(hào)后，由光數(shù)字信號(hào)處理器（DSP）芯片重新整形，再傳輸至光引擎組件進(jìn)行電光轉(zhuǎn)換。光信號(hào)經(jīng)光纖傳輸至鏈路另一端，由另一收發(fā)器執(zhí)行逆向轉(zhuǎn)換流程，將光信號(hào)轉(zhuǎn)為電信號(hào)，最終返回目標(biāo)硅芯片。在此過(guò)程中，電信號(hào)在抵達(dá)光鏈路前需穿越較長(zhǎng)距離（至少對(duì)銅纜而言并經(jīng)歷多次轉(zhuǎn)換點(diǎn)。這導(dǎo)致電信號(hào)逐漸劣化，需要消耗大量能量并采用復(fù)雜電路（串行器/解串器）進(jìn)行驅(qū)動(dòng)與恢復(fù)。為改善這一狀況，我們需要縮短電信號(hào)的傳輸距離。由此催生了"共封裝光器件"的概念——即將原本置于可插拔收發(fā)器中的光引擎與主芯片進(jìn)行共封裝。此方案將電路走線長(zhǎng)度從數(shù)十厘米縮短至數(shù)十毫米，因光引擎與XPU或交換機(jī)ASIC的物理距離大幅縮短。通過(guò)最小化電氣互聯(lián)距離并緩解信號(hào)完整性挑戰(zhàn)，該方案顯著降低功耗、提升帶寬密度并減少延遲。下圖展示了CPO的實(shí)現(xiàn)方案，其中光引擎與計(jì)算芯片或交換芯片集成在同一封裝內(nèi)。初期光引擎將部署在基板上，未來(lái)則會(huì)轉(zhuǎn)移至中介層。來(lái)源：SemiAnalysis來(lái)源：SemiAnalysis如今，如下方示意圖所示的前插拔式光模塊解決方案已廣泛應(yīng)用。該圖的核心要點(diǎn)在于說(shuō)明：電信號(hào)需穿越長(zhǎng)達(dá)15-30厘米的銅跡線或跨接線纜，才能抵達(dá)收發(fā)器中的光引擎。如前所述，這同樣要求采用長(zhǎng)距離（LR）串解碼器（SerDes）來(lái)驅(qū)動(dòng)可插拔模塊。來(lái)源：SemiAnalysis此外，還存在介于CPO與傳統(tǒng)前插式光模塊之間的中間實(shí)現(xiàn)方案，例如近封裝光模塊（NPO）和板載光模塊（OBO）。近年來(lái)，NPO作為邁向CPO的中間過(guò)渡方案應(yīng)運(yùn)而生。NPO存在多種定義：其特征在于光學(xué)引擎(OE）不直接安裝在ASIC基板上，而是與另一基板共同封裝。該光學(xué)引擎仍保持插拔特性，可從基板上拆卸。電氣信號(hào)仍將通過(guò)XPU封裝上的串行器/解串器（SerDes）經(jīng)銅通道傳輸至光學(xué)引擎。來(lái)源：SemiAnalysis還有一種方案是板載光學(xué)器件（OBO它將光學(xué)引擎集成到機(jī)箱內(nèi)的系統(tǒng)PCB上，使其更接近主機(jī)ASIC。然而，OBO不僅繼承了CPO的諸多挑戰(zhàn)，在帶寬密度和功耗節(jié)約方面帶來(lái)的優(yōu)勢(shì)也更少。我們認(rèn)為OBO是"兩全其美的反面典范"，它既保留了CPO的復(fù)雜性，又繼承了前插式光模塊的部分局限性。來(lái)源：SemiAnalysisCPO的另一種替代方案是"共封裝銅線"(CPC)。CPC采用直接從基板連接器引出的銅線纜。CPC使用的線纜與飛線相同，目的也相同：繞過(guò)PCB走線。CPC將飛線技術(shù)進(jìn)一步延伸，使插座直接始于封裝基板本身。所用線纜為雙軸線纜（Twinax其絕緣性能優(yōu)異可有效抑制串?dāng)_，與傳統(tǒng)電路走線相比能顯著降低插入損耗。盡管該方案仍采用銅質(zhì)材料，但在信號(hào)完整性方面具有關(guān)鍵優(yōu)勢(shì)。CPC技術(shù)有望為部署448G串行器-解串器（SerDes）提供可行路徑，從而實(shí)現(xiàn)封裝外互連的進(jìn)一步擴(kuò)展。來(lái)源：立訊精密來(lái)源：立訊精密CPC技術(shù)的挑戰(zhàn)在于封裝基板的復(fù)雜性增加?；灞仨殲閿?shù)千條電纜分配電源和信號(hào)。盡管存在這一挑戰(zhàn)，CPC仍比CPO簡(jiǎn)單得多——后者仍需克服供應(yīng)鏈多個(gè)環(huán)節(jié)的制造障礙。我們認(rèn)為CPC技術(shù)在某些短距離應(yīng)用中具有獨(dú)特優(yōu)勢(shì)，例如機(jī)架級(jí)擴(kuò)展連接（下文將詳述）。通過(guò)規(guī)避損耗性CCL走線，CPC有望成為實(shí)現(xiàn)448G傳輸速率的關(guān)鍵技術(shù)。鑒于該帶寬信號(hào)在PCB傳輸中會(huì)產(chǎn)生不可接受的衰減，CPC技術(shù)正被廣泛研究以支持448G應(yīng)用。CPO技術(shù)市場(chǎng)化進(jìn)程中的歷史障礙：為何直到現(xiàn)在才實(shí)現(xiàn)？盡管技術(shù)上具有優(yōu)勢(shì)，但由于存在若干推高成本的挑戰(zhàn)，CPO在實(shí)際應(yīng)用中的普及仍十分有限。這些挑戰(zhàn)包括：封裝工藝復(fù)雜（成本甚至高于器件本身）、制造難度大、可靠性與良率問(wèn)題，以及光電元件高度集成導(dǎo)致的熱管理難題。另一個(gè)阻礙是行業(yè)標(biāo)準(zhǔn)尚未統(tǒng)一。此外，客戶還擔(dān)憂其可維護(hù)性問(wèn)題。阻礙了從傳統(tǒng)可插拔光模塊向CPO解決方案的過(guò)渡。另一項(xiàng)關(guān)鍵客戶擔(dān)憂在于，采用CPO技術(shù)可能意味著他們將喪失成本控制能力。相較于少數(shù)幾家交換機(jī)供應(yīng)商，向數(shù)量龐大的收發(fā)器廠商施壓降價(jià)顯然更為容易。與此同時(shí)，可插拔光模塊——即CPO將取代的現(xiàn)有技術(shù)——仍在持續(xù)改進(jìn)，其性能足以滿足幾乎所有應(yīng)用需求，且能顯著降低終端用戶的顧慮。在第二部分的剩余內(nèi)容中，我們將深入探討采用CPO的驅(qū)動(dòng)力。首先闡述SerDes擴(kuò)展已趨于飽和，使得寬I/O配合CPO等其他接口類型成為必要選擇，隨后將探討制造考量與市場(chǎng)推廣策略。我們將重點(diǎn)解析關(guān)鍵CPO組件，包括光引擎、光纖耦合器、外部激光源及調(diào)制器。最后，我們將闡述基于CPO技術(shù)實(shí)現(xiàn)帶寬擴(kuò)展的發(fā)展路線圖。超越基于DSP的收發(fā)器：從LPO到CPODSP收發(fā)器同時(shí)處理光信號(hào)的發(fā)送與接收，其內(nèi)部包含負(fù)責(zé)電光轉(zhuǎn)換的"光引擎"(OE)。該光引擎由驅(qū)動(dòng)器(DRV)和調(diào)制器(MOD)組成，用于發(fā)送光信號(hào)；同時(shí)配備跨阻放大器(TIA)和光電探測(cè)器(PD)，用于接收光信號(hào)。另一個(gè)重要組件是光DSP芯片，它有時(shí)會(huì)將驅(qū)動(dòng)器和/或TIA集成到單個(gè)封裝中。從主機(jī)開(kāi)關(guān)或處理芯片傳輸?shù)母哳l電信號(hào)需要通過(guò)損耗性銅跡線傳輸較長(zhǎng)距離，才能到達(dá)服務(wù)器機(jī)箱前端的收發(fā)器。DSP負(fù)責(zé)對(duì)該信號(hào)進(jìn)行重新定時(shí)和重新調(diào)理。它通過(guò)執(zhí)行誤差校正和時(shí)鐘/數(shù)據(jù)恢復(fù)，補(bǔ)償信號(hào)從開(kāi)關(guān)或ASIC芯片經(jīng)基板等傳輸介質(zhì)傳播過(guò)程中產(chǎn)生的電氣劣化與衰減。在調(diào)制方面，對(duì)于PAM4調(diào)制（四電平脈沖幅度調(diào)制DSP將二進(jìn)制信號(hào)映射為四個(gè)獨(dú)立幅度電平，從而增加每信號(hào)位數(shù)，實(shí)現(xiàn)更高比特率和更寬帶寬。Source:SemiAnalysisDSP芯片是收發(fā)器中功耗最高且最昂貴的組件之一，甚至可能是最耗電的部件。以800GSR8收發(fā)器為例——DSP幾乎占用了~50%的模塊總功耗，這正是業(yè)界極力尋求替代DSP方案的核心原因。來(lái)源：RadhaNagarajan博士等：《數(shù)據(jù)中心應(yīng)用低功耗數(shù)字信號(hào)處理技術(shù)的最新進(jìn)展》構(gòu)建一個(gè)采用雙層InfiniBand網(wǎng)絡(luò)的18kGB300集群，需配備18,432個(gè)800GDR4收發(fā)器和27,648個(gè)1.6TDR8收發(fā)器。DSP帶來(lái)的額外成本與功耗需求將顯著增加整體擁有成本。按800GDSP功耗6-7W、1.6TDSP功耗12-14W估算僅后端網(wǎng)絡(luò)部分的DSP功耗就將達(dá)到480kW，相當(dāng)于每臺(tái)服務(wù)器機(jī)架約1.8kW。若采購(gòu)自高端品牌供應(yīng)商，收發(fā)器成本可能占集群總擁有成本近10%。因此——考慮到DSP占典型收發(fā)器功耗的50%及物料清單成本的20-30%——許多人視DSP為成本與能效領(lǐng)域的頭號(hào)公敵。反DSP運(yùn)動(dòng)DSP的高成本和高功耗特性促使業(yè)界尋求能夠繞過(guò)DSP的中間環(huán)節(jié)的技術(shù)。針對(duì)DSP的首輪攻勢(shì)是線性可插拔光模塊（LPO）——該方案試圖徹底移除DSP，讓交換機(jī)的串解碼器直接驅(qū)動(dòng)收發(fā)器中的發(fā)射/接收光元件。然而正如DSP先知LoiNguyen在2023年接受我們采訪時(shí)準(zhǔn)確預(yù)言的那樣，LPO至今仍未實(shí)現(xiàn)大規(guī)模應(yīng)用。CPO將LPO概念推進(jìn)到新階段，將光引擎與計(jì)算或交換芯片封裝在同一封裝內(nèi)。其關(guān)鍵優(yōu)勢(shì)在于，由于主機(jī)與光引擎間距極短，收發(fā)器中的DSP已不再必要。CPO的突破性還在于：通過(guò)淘汰功耗高、占面積大的長(zhǎng)距離SerDes，轉(zhuǎn)而采用短距離SerDes，甚至在寬I/O接口場(chǎng)景下采用時(shí)鐘前傳式寬D2DSerDes，從而大幅提升芯片封裝密度。官方引述的說(shuō)法是，CPO技術(shù)過(guò)去二十年間始終近在咫尺——但為何遲遲未能普及？為何業(yè)界仍傾向于采用可插拔DSP收發(fā)器？可插拔收發(fā)器的核心優(yōu)勢(shì)在于其卓越的互操作性。憑借OSFP和QSFP-DD等標(biāo)準(zhǔn)封裝形式，并遵循OIF規(guī)范，客戶通?？瑟?dú)立于交換機(jī)和服務(wù)器供應(yīng)商選擇收發(fā)器廠商，從而獲得采購(gòu)靈活性和更強(qiáng)的議價(jià)能力。另一個(gè)巨大優(yōu)勢(shì)在于現(xiàn)場(chǎng)可維護(hù)性。收發(fā)器的安裝與更換極為簡(jiǎn)便，只需遠(yuǎn)程操作人員拔出交換機(jī)或服務(wù)器機(jī)箱中的插頭即可。相比之下，采用CPO方案時(shí)，光引擎的任何故障都可能導(dǎo)致整臺(tái)交換機(jī)癱瘓。即便可維修的故障也可能面臨復(fù)雜的排查與修復(fù)過(guò)程。激光器作為最常見(jiàn)的故障點(diǎn)，當(dāng)前多數(shù)CPO方案已采用可插拔外部激光源以提升可維護(hù)性與可替換性，但其他不可插拔CPO組件的故障風(fēng)險(xiǎn)仍令人憂心。除淘汰耗電且昂貴的DSP器件、最大限度減少或消除LRSerDes使用外，采用CPO的另一重大優(yōu)勢(shì)在于其在能耗水平下能實(shí)現(xiàn)更高的互連帶寬密度。帶寬密度衡量單位面積或通道傳輸?shù)臄?shù)據(jù)量，反映有限空間用于高速數(shù)據(jù)傳輸?shù)睦眯?。能效則量化傳輸單位數(shù)據(jù)所需的能量消耗。因此，在評(píng)估特定互連結(jié)構(gòu)的客觀質(zhì)量時(shí)，互連帶寬密度與能耗之比成為至關(guān)重要的性能指標(biāo)（FoM)。當(dāng)然，最優(yōu)互連方案還需滿足距離和成本參數(shù)的約束條件。觀察下圖可發(fā)現(xiàn)明顯趨勢(shì)：隨著距離增加，電氣鏈路的該性能指標(biāo)呈指數(shù)級(jí)惡化。此外，從純電氣接口轉(zhuǎn)向需要光電轉(zhuǎn)換的接口時(shí)，會(huì)引入效率大幅下降——可能達(dá)到數(shù)量級(jí)的降幅。這種下降源于信號(hào)從芯片傳輸至前板收發(fā)器所需的能量消耗，而驅(qū)動(dòng)光DSP則需要更多能量。基于CPO的通信性能指標(biāo)曲線明顯優(yōu)于可插拔模塊。如下方圖表所示，在相同傳輸距離范圍內(nèi)，CPO技術(shù)在單位面積能耗下提供更高的帶寬密度，客觀上成為更優(yōu)的互連方案。來(lái)源：G·基勒，DARPA2019，SemiAn該圖表也印證了"能用銅纜就用銅纜，必須用光纖才用光纖"的行業(yè)箴言。在可行的情況下，短距離銅纜通信更具優(yōu)勢(shì)。英偉達(dá)秉承這一理念，其機(jī)架級(jí)GPU架構(gòu)專為突破機(jī)架內(nèi)密度極限而設(shè)計(jì)，旨在最大化通過(guò)銅纜聯(lián)網(wǎng)的GPU數(shù)量。這正是GB200NVL72采用縱向擴(kuò)展網(wǎng)絡(luò)架構(gòu)的邏輯基礎(chǔ)，而英偉達(dá)在Kyber機(jī)架中將這一理念推向極致。然而——隨著光纖光柵（CPO）技術(shù)的成熟，其性能曲線將逐步覆蓋縱向擴(kuò)展場(chǎng)景，從每TCO性能角度考量，其應(yīng)用價(jià)值終將顯現(xiàn)，這只是時(shí)間問(wèn)題。知識(shí)星球：前沿信訂閱錄獲取更多一手外資研究報(bào)告，請(qǐng)?zhí)砑游⑿牛罕M管晶體管密度和計(jì)算能力（以FLOPs為代表）實(shí)現(xiàn)了良好擴(kuò)展，I/O的擴(kuò)展速度卻明顯滯后，導(dǎo)致整體系統(tǒng)性能出現(xiàn)瓶頸：由于數(shù)據(jù)需通過(guò)有機(jī)封裝基板上有限數(shù)量的I/O接口傳輸，芯片外I/O的可用岸線資源極為有限。此外，提升單個(gè)I/O接口的信號(hào)傳輸速度正變得日益困難且耗能巨大，進(jìn)一步制約了數(shù)據(jù)流動(dòng)。這正是過(guò)去數(shù)十年間，相較于其他計(jì)算技術(shù)趨勢(shì)，互連帶寬提升如此緩慢的關(guān)鍵原因。由于單個(gè)倒裝芯片BGA封裝中凸點(diǎn)數(shù)量的限制，面向HPC應(yīng)用的封裝外I/O密度已趨于平穩(wěn)。這成為突破帶寬瓶頸的關(guān)鍵制約因素。來(lái)源：臺(tái)積電在I/O接口數(shù)量有限的情況下，實(shí)現(xiàn)更高逃逸帶寬的方法是提升每個(gè)I/O信號(hào)的傳輸頻率。目前，英偉達(dá)和博通在串行器/解串器（SerDes）IP領(lǐng)域處于領(lǐng)先地位。英偉達(dá)在Blackwell芯片中搭載了224GSerDes技術(shù)，正是這項(xiàng)技術(shù)賦予了其NVLink閃電般的傳輸速度。同樣，自2024年末起，博通已在光DSP中開(kāi)始提供224GSerDes樣品。業(yè)內(nèi)AI浮點(diǎn)運(yùn)算性能領(lǐng)先的兩家企業(yè)同時(shí)主導(dǎo)高速SerDesIP領(lǐng)域絕非偶然。這印證了AI性能與吞吐量之間的根本關(guān)聯(lián)——最大化數(shù)據(jù)傳輸效率與提供原始計(jì)算能力同樣關(guān)鍵。然而，在理想傳輸距離下提供更高線路速率正變得日益困難。如下圖所示，隨著頻率增加，插入損耗隨之上升。我們觀察到，在更高的串行器/解串器（SerDes）信號(hào)傳輸速率下，尤其是信號(hào)路徑延長(zhǎng)時(shí),損耗會(huì)顯著增加。來(lái)源：博通SerDes技術(shù)正趨于瓶頸期。更高傳輸速率僅能在極短距離內(nèi)維持，且需額外添加信號(hào)恢復(fù)組件——這反過(guò)來(lái)又增加了系統(tǒng)復(fù)雜度、成本、延遲及功耗。實(shí)現(xiàn)224GSerDes技術(shù)始終面臨巨大挑戰(zhàn)。展望448G串解碼器技術(shù)，其傳輸距離能否突破數(shù)厘米仍存在較大不確定性。英偉達(dá)通過(guò)雙向串解碼技術(shù)在Rubin平臺(tái)實(shí)現(xiàn)了每電氣通道448G的連接能力。要實(shí)現(xiàn)真正的448G單向串解碼器，仍需進(jìn)一步研發(fā)。我們可能需要轉(zhuǎn)向更高階調(diào)制方案，例如PAM6或PAM8，而非自56GSerDes時(shí)代以來(lái)廣泛采用的PAM4調(diào)制。若使用每信號(hào)編碼2位的PAM4方案實(shí)現(xiàn)448G傳輸，將需要244Gbaud的波特率，這因過(guò)高的功耗和插入損耗而難以實(shí)現(xiàn)。在NVLink協(xié)議中，NVLink5.0的帶寬較NVLink1.0提升了11倍以上。然而，這種增長(zhǎng)并非源于通道數(shù)量的顯著增加——通道數(shù)僅從NVLink1.0的32條略微提升至NVLink5.0的36條。帶寬提升的核心驅(qū)動(dòng)力在于串行器/解串器（SerDes）通道速度的十倍增長(zhǎng)——從20G提升至200G。但在NVLink6.0中,英偉達(dá)預(yù)計(jì)將維持200GSerDes規(guī)格，這意味著必須實(shí)現(xiàn)通道數(shù)量的倍增——而該方案確實(shí)做到了這一點(diǎn)。通過(guò)巧妙運(yùn)用雙向SerDes技術(shù)，在保持物理銅線數(shù)量不變的前提下，有效實(shí)現(xiàn)了通道數(shù)量的倍增。然而，進(jìn)一步提升SerDes速度或突破海岸線資源限制以增加通道數(shù)量將日益困難，最終逃逸帶寬將陷入瓶頸。提升逃逸帶寬對(duì)處于技術(shù)前沿的企業(yè)至關(guān)重要，因?yàn)橥掏铝渴瞧浜诵母?jìng)爭(zhēng)力。對(duì)于英偉達(dá)而言，其NVLink縱向擴(kuò)展架構(gòu)是重要護(hù)城河，這一瓶頸可能使AMD等競(jìng)爭(zhēng)對(duì)手及超大規(guī)模企業(yè)更容易迎頭趕上。來(lái)源：英偉達(dá)、SemiAnalysis來(lái)源：英偉達(dá)、SemiAnalysis解決這一困境的方案——或者說(shuō)必要的折衷方案——是盡可能縮短電氣I/O距離，并將數(shù)據(jù)傳輸卸載至盡可能靠近主機(jī)ASIC的光學(xué)鏈路，從而實(shí)現(xiàn)更高帶寬。正因如此，CPO被視為互連技術(shù)的"圣杯"。無(wú)論通過(guò)基板還是中介層，CPO都能在ASIC封裝上實(shí)現(xiàn)光通信。電信號(hào)僅需在封裝基板內(nèi)傳輸幾毫米距離，或理想情況下，應(yīng)通過(guò)更高品質(zhì)的中介層實(shí)現(xiàn)更短的傳輸距離，而非通過(guò)數(shù)十厘米的損耗性覆銅層壓板（CCL）。相反，SerDes可針對(duì)短距離傳輸進(jìn)行優(yōu)化，其所需電路遠(yuǎn)少于同等長(zhǎng)距離的SerDes。這不僅簡(jiǎn)化了設(shè)計(jì)流程，還降低了功耗和硅片面積。這種簡(jiǎn)化使得高速SerDes更易實(shí)現(xiàn)，并延長(zhǎng)了SerDes的擴(kuò)展路線圖。然而，我們?nèi)允苤朴趥鹘y(tǒng)帶寬模型——帶寬密度仍與SerDes速度成正比增長(zhǎng)。為實(shí)現(xiàn)更高的帶寬密度，在極短距離內(nèi)采用寬I/O物理層是優(yōu)于串行器/解串器接口的選擇，其單位功耗帶寬密度更優(yōu)。但寬I/O技術(shù)需以更復(fù)雜的封裝工藝為代價(jià)。不過(guò)對(duì)于CPO而言，這點(diǎn)差異可忽略不計(jì)：其封裝技術(shù)本就高度先進(jìn)，集成寬I/O物理層幾乎不會(huì)增加額外封裝復(fù)雜度。當(dāng)無(wú)需驅(qū)動(dòng)電信號(hào)傳輸至較長(zhǎng)距離時(shí)，我們完全可以擺脫串行化接口，轉(zhuǎn)而采用寬接口——其在短距離內(nèi)能提供更優(yōu)的海岸線密度。UCIe接口便是典型案例。UCIe-A可提供高達(dá)約10Tbit/s/mm的岸線密度，專為先進(jìn)封裝設(shè)計(jì)（例如通過(guò)中介層實(shí)現(xiàn)2mm以下連接距離的芯片級(jí)封裝）。在光罩尺寸芯片的長(zhǎng)邊上，其封裝外帶寬可達(dá)330Tbit/s（41TByte/s）。若兩側(cè)邊緣同時(shí)使用，雙向帶寬可達(dá)660Tbit/s。相比之下，Blackwell架構(gòu)僅提供23.6Tbit/s的封裝外帶寬，相當(dāng)于約0.4Tbit/s/mm的海岸線密度，兩者差距顯著。來(lái)源：SemiAnalysis來(lái)源：SemiAnalysis當(dāng)然——這并非同等條件下的比較，因?yàn)檫@些離封裝物理層器件需要驅(qū)動(dòng)長(zhǎng)距離傳輸。若真要說(shuō)的話，這恰恰印證了核心觀點(diǎn)：采用CPO技術(shù)后，傳輸距離不再是瓶頸，因?yàn)樾盘?hào)不再需要通過(guò)電信號(hào)進(jìn)行長(zhǎng)距離驅(qū)動(dòng)。當(dāng)帶寬密度達(dá)到10Tbit/s/mm時(shí)，瓶頸已不再是電氣接口，而是鏈路的其他環(huán)節(jié)——即另一端光纖能承載多少帶寬。達(dá)到這種限制是遠(yuǎn)離當(dāng)今現(xiàn)實(shí)的終極狀態(tài)，而OE在路線圖上的實(shí)現(xiàn)難度甚至遠(yuǎn)超在基板上可靠集成OE?；迳衔锢韺有阅芄倘惠^弱，UCIe-S技術(shù)僅能提供約1.8Tbit/s/mm的海岸線密度。但相較于我們預(yù)估的224G串行器解串器約0.4Tbit/s/mm的水平,這仍屬顯著提升。然而，盡管寬帶接口具有諸多優(yōu)勢(shì)，博通和英偉達(dá)仍在其路線圖中堅(jiān)持采用電信號(hào)收發(fā)器（SerDes）。主要原因在于他們認(rèn)為SerDes仍有擴(kuò)展空間，且需要針對(duì)銅纜進(jìn)行設(shè)計(jì)——尤其在光纖技術(shù)普及緩慢的背景下。此外，混合封裝銅纜與光纖的解決方案似乎更可能長(zhǎng)期存在，這迫使他們必須同時(shí)優(yōu)化兩種技術(shù)。此策略旨在避免不同方案需多次流片測(cè)試的繁瑣流程。鏈路彈性和可靠性是推動(dòng)CPO技術(shù)發(fā)展的另一重要因素。在大型人工智能集群中，鏈路停機(jī)時(shí)間是影響整體集群可用性的關(guān)鍵因素，即使鏈路可用性和穩(wěn)定性獲得微小提升，也能為基礎(chǔ)設(shè)施投資帶來(lái)顯著回報(bào)。如今，在接近100萬(wàn)個(gè)鏈接且采用可插拔模塊的大型AI集群中，每天可能發(fā)生數(shù)十次鏈接中斷。其中部分屬于因元件故障或硬件質(zhì)量導(dǎo)致的"硬性"故障，而多數(shù)則是源于可插拔解決方案固有復(fù)雜性和變異性的多樣化根本原因所引發(fā)的"軟性"故障。故障模式呈現(xiàn)長(zhǎng)尾分布，包括但不限于信號(hào)完整性問(wèn)題與波動(dòng)、連接器及焊線質(zhì)量、元件與引腳污染、噪聲注入及其他瞬態(tài)效應(yīng)。這些故障與元件失效關(guān)聯(lián)性較弱——因鏈路故障退回的光模塊中，80%最終檢測(cè)結(jié)果為"未發(fā)現(xiàn)故障"。通過(guò)以下方式，CPO顯著降低了大規(guī)模AI網(wǎng)絡(luò)中高速信號(hào)路徑的固有復(fù)雜性和變異性：大幅減少光接口元件數(shù)量。在光子層面和芯片/封裝層面的高度集成，降低了關(guān)鍵高速組件的復(fù)雜性，并提升了系統(tǒng)級(jí)可靠性與良率。同時(shí)減少了電光接口數(shù)量，從而最大限度地減少每個(gè)接口處發(fā)生的功率損耗顯著提升主機(jī)ASIC（如交換機(jī)）與光引擎之間主機(jī)電氣接口的信號(hào)完整性。通過(guò)采用設(shè)計(jì)規(guī)則和制造公差明確可控的一級(jí)封裝工藝，大幅降低光引擎的插入損耗、反射及其他非線性損傷減少交換機(jī)高速信號(hào)路徑中端口間性能波動(dòng)，該波動(dòng)會(huì)增加DSP信號(hào)處理、主機(jī)與模塊均衡、主機(jī)與模塊固件及鏈路優(yōu)化算法的開(kāi)銷與復(fù)雜度。所有可插拔模塊方案及主機(jī)串解碼器均需針對(duì)端口間性能差異進(jìn)行設(shè)計(jì)，此類差異將導(dǎo)致系統(tǒng)復(fù)雜度提升并增加故障點(diǎn)。消除光鏈路配置中的"人為因素"。CPO交換機(jī)或光引擎出廠時(shí)已完成全套組裝和測(cè)試，確保"已知良好"狀態(tài)，無(wú)需在現(xiàn)場(chǎng)進(jìn)行大量操作即可完成交換機(jī)內(nèi)光模塊的配置。這可避免安裝差異、損壞、污染以及系統(tǒng)與光模塊間的兼容性問(wèn)題。目前CPO尚未實(shí)現(xiàn)足以支撐大規(guī)模應(yīng)用的量產(chǎn)規(guī)模。博通是唯一一家推出搭載CPO技術(shù)的商用系統(tǒng)的供應(yīng)商，其Bailly和Humboldt交換機(jī)曾實(shí)現(xiàn)量產(chǎn)，但如今英偉達(dá)也加入了競(jìng)爭(zhēng)行列。這些產(chǎn)品的出貨量仍處于極低水平。CPO引入了諸多新型制造工藝，帶來(lái)了顯著的可制造性挑戰(zhàn)。鑒于供應(yīng)鏈尚不成熟且可靠性數(shù)據(jù)匱乏，客戶對(duì)采用該技術(shù)持謹(jǐn)慎態(tài)度實(shí)屬情理之中。要使CPO技術(shù)獲得廣泛應(yīng)用，行業(yè)領(lǐng)軍企業(yè)必須投資于這些產(chǎn)品的運(yùn)輸，推動(dòng)供應(yīng)鏈建立可擴(kuò)展的制造和測(cè)試流程。英偉達(dá)正率先投身其中，其目標(biāo)是完善供應(yīng)鏈體系，識(shí)別并解決問(wèn)題，為數(shù)據(jù)中心運(yùn)營(yíng)商做好準(zhǔn)備：前沿信息收錄將成為"殺手級(jí)"應(yīng)用：大規(guī)模網(wǎng)絡(luò)。關(guān)于CPO有幾個(gè)關(guān)鍵組件和考量點(diǎn)需要關(guān)注，這些都將影響性能和可制造性。具體包括：1.主機(jī)與光引擎封裝2.光纖與光纖耦合3.激光源與波長(zhǎng)復(fù)用4.調(diào)制器類型顧名思義，“共封裝光學(xué)器件”本質(zhì)上是封裝與組裝方面的挑戰(zhàn)。光引擎同時(shí)包含光學(xué)部件與電子元件。光探測(cè)器和調(diào)制器作為光學(xué)部件，集成于"PIC"（光子集成電路）內(nèi)部。驅(qū)動(dòng)器和跨阻放大器則是"EIC"（電集成電路）中的電子電路。PIC與EIC必須集成才能使光學(xué)引擎正常工作。目前存在多種封裝方法實(shí)現(xiàn)這種PIC-EIC集成。光引擎可通過(guò)將PIC與EIC集成于同一硅晶圓實(shí)現(xiàn)單片化。就寄生效應(yīng)、延遲及功耗而言，單片集成是最優(yōu)雅的解決方案。寄生效應(yīng)、延遲和功耗方面最為優(yōu)雅。Ayar第二代TeraPHY芯片組（盡管其下一代芯片組轉(zhuǎn)向臺(tái)積電COUPE工藝）。格羅方德、Tower和AdvancedMicroFoundry等代工廠可提供單片CMOS和SiPho工藝。然而，由于光子工藝無(wú)法像傳統(tǒng)CMOS那樣縮放，單片工藝在35納米以下的尺寸節(jié)點(diǎn)便難以推進(jìn)。這限制了EIC（光子集成電路）的能力，尤其在CPO系統(tǒng)預(yù)期更高通道速率的背景下。盡管單片集成具有固有的簡(jiǎn)潔性與優(yōu)雅性，但這使其成為縮放過(guò)程中的關(guān)鍵障礙。正因如此，AyarLabs也正將路線圖轉(zhuǎn)向異構(gòu)集成光子芯片（OEs）,以實(shí)現(xiàn)更進(jìn)一步的縮放。異構(gòu)集成正成為主流方案，其工藝流程包括采用SiPho工藝制造光子集成電路（PIC并通過(guò)先進(jìn)封裝技術(shù)將其與CMOS晶圓上的電子集成電路（EIC）實(shí)現(xiàn)集成?，F(xiàn)有封裝方案種類繁多，更先進(jìn)的封裝技術(shù)能帶來(lái)更高性能。其中，3D集成技術(shù)在帶寬和能效方面表現(xiàn)最為優(yōu)異。EIC與PIC通信面臨的核心挑戰(zhàn)在于寄生參數(shù)對(duì)性能的侵蝕?？s短走線長(zhǎng)度能顯著降低寄生參數(shù)，從而提升耦合效率：從帶寬和功耗角度看，3D集成是實(shí)現(xiàn)CPO性能目標(biāo)的唯一途徑。臺(tái)積電正作為下一代光電元件制造商的首選代工合作伙伴，在無(wú)晶圓廠巨頭與初創(chuàng)企業(yè)中加速布局。首批搭載CPO終端的高產(chǎn)量產(chǎn)品以"COUPE"（緊湊型通用光子引擎）之名面世，涵蓋EIC與PIC的制造，以及臺(tái)積電COUPE解決方案下的異構(gòu)集成。英偉達(dá)在GTC2025大會(huì)上隆重展示了其COUPE光引擎，這些將成為首批量產(chǎn)的COUPE產(chǎn)品。博通公司盡管現(xiàn)有光引擎產(chǎn)品線仍與其他供應(yīng)鏈伙伴合作，但未來(lái)路線圖也將采用COUPE方案。如前所述，此前依賴格羅方德Fotonix平臺(tái)生產(chǎn)單片光引擎的AyarLabs，如今同樣將COUPE納入其產(chǎn)品規(guī)劃。與在傳統(tǒng)CMOS邏輯領(lǐng)域的主導(dǎo)地位不同，臺(tái)積電此前在硅光子學(xué)領(lǐng)域的布局有限，該領(lǐng)域主要由格羅方德和臺(tái)積電的合作伙伴塔半導(dǎo)體主導(dǎo)。然而近年來(lái)，臺(tái)積電在光子技術(shù)能力方面正迅速迎頭趕上。臺(tái)積電還憑借無(wú)可爭(zhēng)議的工藝優(yōu)勢(shì)，在光子芯片制造領(lǐng)域占據(jù)領(lǐng)先地位。光子技術(shù)領(lǐng)域的差距。臺(tái)積電還憑借其無(wú)可爭(zhēng)議的臺(tái)積電在EIC組件的前沿CMOS邏輯技術(shù)方面實(shí)力雄厚，同時(shí)擁有領(lǐng)先的封裝能力——作為唯一成功實(shí)現(xiàn)大規(guī)模晶粒到晶圓混合鍵合的代工廠，臺(tái)積電已批量交付多種AMD混合鍵合芯片。混合鍵合是連接PIC和EIC的更高效方案，但成本顯著更高。英特爾正致力于開(kāi)發(fā)類似技術(shù)，但在開(kāi)拓這項(xiàng)技術(shù)過(guò)程中面臨重大挑戰(zhàn)?？傮w而言，盡管臺(tái)積電此前在獨(dú)立硅光子領(lǐng)域?qū)嵙^弱，如今已然成為CPO領(lǐng)域的重要參與者。與其他主要玩家一樣，臺(tái)積電致力于盡可能掌控價(jià)值鏈的各個(gè)環(huán)節(jié)。采用臺(tái)積電COUPE解決方案的客戶，實(shí)際上承諾將使用臺(tái)積電制造的光子芯片，因?yàn)榕_(tái)積電不為其他代工廠的硅光子晶圓提供封裝服務(wù)。許多專注于CPO領(lǐng)域的公司確實(shí)已果斷轉(zhuǎn)向采用臺(tái)積電的COUPE方案，將其作為未來(lái)幾年的核心市場(chǎng)解決方案。來(lái)源：臺(tái)積電芯片制造：臺(tái)積電提供全面的芯片制造解決方案。EIC芯片采用N7工藝節(jié)點(diǎn)制造，集成高速光調(diào)制器驅(qū)動(dòng)器和電致導(dǎo)電放大器（TIAs并配備加熱器控制器以實(shí)現(xiàn)波長(zhǎng)穩(wěn)定等功能。而PIC芯片則基于SOIN65工藝節(jié)點(diǎn)制造，臺(tái)積電為光子電路設(shè)計(jì)、光子布局設(shè)計(jì)與驗(yàn)證，以及光子電路仿真建模（涵蓋射頻、噪聲及多波長(zhǎng)等維度）。EIC與PIC采用臺(tái)積電SoIC鍵合工藝進(jìn)行封裝。如前所述，更長(zhǎng)的走線長(zhǎng)度意味著更多寄生參數(shù)，從而降低性能。臺(tái)積電的SoIC作為無(wú)凸點(diǎn)接口，在非單片結(jié)構(gòu)下實(shí)現(xiàn)了最短走線長(zhǎng)度，因此是異構(gòu)集成EIC與PIC的最佳性能方案。如下圖所示，在等功耗條件下，基于SoIC的光電器件（OE）的帶寬密度是采用凸點(diǎn)集成OE的23倍以上。來(lái)源：臺(tái)積電COUPE支持整個(gè)光學(xué)引擎的設(shè)計(jì)與集成流程。在光I/O領(lǐng)域，其支持微透鏡設(shè)計(jì)，可實(shí)現(xiàn)晶圓級(jí)或芯片級(jí)微透鏡集成，并提供涵蓋反射鏡、微透鏡、光柵耦合器（GC）及反射器的光I/O路徑仿真。在3D堆疊領(lǐng)域，其支持3D平面布局規(guī)劃、SoIC-X/TDV/C4凸點(diǎn)布局實(shí)現(xiàn)、接口物理驗(yàn)證，以及高頻通道模型提取與仿真。為保障無(wú)縫開(kāi)發(fā)流程，公司提供完整的COUPE設(shè)計(jì)驗(yàn)證PDK與EDA工作流,助力設(shè)計(jì)師高效實(shí)現(xiàn)技術(shù)方案。耦合：如后文將詳細(xì)闡述，主要存在兩種耦合方式——光柵耦合（GC）與邊緣耦合（EC）。COUPE采用基于PIC無(wú)凸點(diǎn)堆疊結(jié)構(gòu)的通用EIC實(shí)現(xiàn)GC與EC雙重功能。但COUPE-GC結(jié)構(gòu)將采用硅透鏡（Si透鏡）與MR（金屬反射器而COUPE-EC則基于770微米硅載體（Si-carrier）設(shè)計(jì)，MR直接置于GC下方，并配置優(yōu)化光學(xué)性能所需的介質(zhì)層。隨后通過(guò)晶圓對(duì)晶圓（WoW）鍵合技術(shù)將Si-carrier與晶圓對(duì)晶圓（CoW）晶圓結(jié)合。來(lái)源：臺(tái)積電來(lái)源：臺(tái)積電光纖耦合單元（FAUFAU需根據(jù)COUPE的光路進(jìn)行協(xié)同設(shè)計(jì)。其設(shè)計(jì)目的是將硅透鏡的光信號(hào)以低插入損耗耦合至光纖。隨著輸入輸出端口數(shù)量增加，制造難度隨之提升，但若行業(yè)能遵循特定標(biāo)準(zhǔn)，則可縮短開(kāi)發(fā)周期并降低成本。總體而言，每個(gè)組件均需優(yōu)化設(shè)計(jì)以實(shí)現(xiàn)最佳光學(xué)性能。來(lái)源：臺(tái)積電產(chǎn)品路線圖：COUPE的首批迭代產(chǎn)品將采用基板上光學(xué)引擎（OE）方案，最終目標(biāo)是實(shí)現(xiàn)將OE置于中介層（interposer）之上。中介層能提供遠(yuǎn)高于基板的I/O密度，從而在OE與ASIC物理層之間實(shí)現(xiàn)更高帶寬，單個(gè)OE可達(dá)12.8Tbit/s帶寬，相當(dāng)于約4Tbit/s/mm。集成中介層的挑戰(zhàn)在于縮放中介層尺寸（其成本高于封裝基板),以適配光學(xué)引擎。正因如此，博通正將其CPO解決方案轉(zhuǎn)向臺(tái)積電的COUPE工藝——盡管此前已采用新世科開(kāi)發(fā)的扇出型晶圓級(jí)封裝（FOWLP）技術(shù)迭代了多代CPO產(chǎn)品。值得注意的是，博通已承諾在未來(lái)的交換機(jī)和客戶加速器產(chǎn)品路線圖中全面采用COUPE工藝。我們了解到，由于寄生電容過(guò)高，F(xiàn)OWLP技術(shù)無(wú)法實(shí)現(xiàn)每通道100G以上的擴(kuò)展——因?yàn)殡娦盘?hào)必須通過(guò)通模孔（TMV）才能到達(dá)EIC。為保持技術(shù)路線的競(jìng)爭(zhēng)力，博通必須轉(zhuǎn)向性能更優(yōu)、可擴(kuò)展性更強(qiáng)的COUPE技術(shù)。這凸顯了臺(tái)積電的技術(shù)優(yōu)勢(shì),使其即便在傳統(tǒng)弱項(xiàng)的光學(xué)領(lǐng)域也能贏得訂單。來(lái)源：博通來(lái)源：博通光學(xué)元件（OEs）本身放置在基板上，隨后基板通過(guò)倒裝芯片技術(shù)與主機(jī)封裝體進(jìn)行鍵合。為實(shí)現(xiàn)光學(xué)元件的共封裝，需要大量封裝區(qū)域。這要求大幅擴(kuò)大封裝基板或信息收錄介質(zhì)板，具體取決于其放置位置。對(duì)于英偉達(dá)的Srum-Xi：c前s沿信息收錄切換ASIC封裝，基板尺寸將達(dá)110mm×110mm。作為參考，Blackwell封裝尺寸為70mm×76mm，而該芯片本身已屬大型芯片。此外，在基板上附加更多元件會(huì)帶來(lái)良率挑戰(zhàn)。以Spectrum-X為例，需先將36個(gè)已知良品的光電元件進(jìn)行倒裝芯片鍵合至基板，隨后才能進(jìn)行"基板上"步驟的互連模塊鍵合，最終完成共封裝(CoWoS）組裝。同樣地，對(duì)于中介層而言，制造更大尺寸中介層的成本高昂，且需要鍵合更多元件，這帶來(lái)了良率方面的挑戰(zhàn)。此外，翹曲問(wèn)題加劇了這些挑戰(zhàn)，隨著中介層/基板尺寸的縮小，翹曲問(wèn)題變得更加明顯。光纖從光電轉(zhuǎn)換器（OE）中引出以傳輸數(shù)據(jù)。一條光通道由兩根光纖或一對(duì)光纖（發(fā)送加接收）組成。光纖耦合——將光纖與芯片波導(dǎo)精確對(duì)準(zhǔn)以實(shí)現(xiàn)順暢高效的光傳輸——是CPO中至關(guān)重要且極具挑戰(zhàn)性的步驟，光纖陣列單元（FAU）在CPO中被廣泛應(yīng)用以輔助該過(guò)程。主要有兩種實(shí)現(xiàn)方式：邊緣耦合（EC）和光柵耦合（GC）。邊緣耦合將光纖沿芯片邊緣對(duì)齊。從下圖可見(jiàn)，光纖端面必須與芯片拋光邊緣精確對(duì)準(zhǔn)，以確保光束準(zhǔn)確進(jìn)入邊緣耦合器。光纖末端的微透鏡將光線聚焦并引導(dǎo)至芯片，使其進(jìn)入波導(dǎo)。波導(dǎo)錐體逐漸擴(kuò)寬，實(shí)現(xiàn)平滑的模式過(guò)渡，從而減少反射和散射以確保耦合效率。若缺少該透鏡和錐體結(jié)構(gòu)，光纖端面與波導(dǎo)端面之間的界面將產(chǎn)生顯著的光學(xué)損耗。Ansys邊緣耦合器因其耦合損耗低、工作波長(zhǎng)范圍廣且對(duì)偏振不敏感而備受青睞。然而它也存在若干缺點(diǎn)：1.制造工藝更為復(fù)雜，需要進(jìn)行底切和深蝕刻；2.因?qū)僖痪S結(jié)構(gòu)，光纖密度受限；3.與芯片堆疊工藝不兼容（因TSV需減?。?；4.在結(jié)構(gòu)尺寸、機(jī)械應(yīng)力、翹曲及光纖處理方面存在機(jī)械可靠性挑戰(zhàn)；5.熱可靠性較低；6.整體生態(tài)系統(tǒng)兼容性不足。全球晶圓廠（GFS）在今年的VLSI大會(huì)上展示了其標(biāo)志性45納米"Fotonix"平臺(tái)上實(shí)現(xiàn)的單片集成SiN邊緣耦合器，該器件支持32通道且間距達(dá)127微米。在光柵耦合器（GC）中，光線從頂部進(jìn)入，光纖以微小角度置于光柵上方。當(dāng)光線抵達(dá)光柵時(shí)，其周期性結(jié)構(gòu)會(huì)將光線散射并向下彎曲至波導(dǎo)中。光柵/垂直耦合的主要優(yōu)勢(shì)在于可容納多排光纖，從而實(shí)現(xiàn)單個(gè)光引擎搭載更多光纖。此外，光柵耦合器無(wú)需置于基板底部，使得光引擎能夠部署在中介層上。最后，GC無(wú)需極高精度定位，且可通過(guò)簡(jiǎn)單的兩步蝕刻工藝更易于制造。其缺點(diǎn)在于單偏振光柵耦合器僅適用于有限波長(zhǎng)范圍，且對(duì)偏振方向極為敏感。英偉達(dá)傾向于采用GC技術(shù)，因其具備多重優(yōu)勢(shì)——相較于EC技術(shù)，它能實(shí)現(xiàn)更高2D密度、占用更小空間、更易于制造，并能簡(jiǎn)化晶圓級(jí)測(cè)試流程。然而該公司也意識(shí)到GC存在若干缺陷——通常會(huì)引入更高光損耗，且光帶寬較EC更窄（后者通常能覆蓋更寬的光譜范圍）。臺(tái)積電同樣明顯更傾向于GC技術(shù)，其COUPE平臺(tái)也支持該技術(shù)。將激光器集成到CPO中主要有兩種方式。第一種方案——片上激光器，將激光器與調(diào)制器集成于同一光子芯片上，通常通過(guò)將III-V族（InP）材料鍵合到硅基底實(shí)現(xiàn)。盡管片上激光器簡(jiǎn)化了設(shè)計(jì)并降低了插入損耗，但仍存在若干挑戰(zhàn)：1.激光器素來(lái)是系統(tǒng)中最易失效的元件之一——若集成至CPO引擎，其故障將引發(fā)連鎖反應(yīng)，導(dǎo)致整個(gè)芯片失效；2.激光器對(duì)熱敏感，若將其放置在共封裝光學(xué)元件上，將暴露于高溫環(huán)境——因其緊鄰系統(tǒng)最熱部件（主硅片這只會(huì)加劇問(wèn)題；3.片上激光器通常難以提供足夠高的功率輸出。業(yè)界達(dá)成共識(shí)的解決方案是采用外部光源（ELS）。激光器置于獨(dú)立模塊中，通過(guò)光纖連接至光學(xué)引擎。這類激光器通常采用OSFP等可插拔封裝形式。此方案在激光器故障的常見(jiàn)場(chǎng)景下，能簡(jiǎn)化現(xiàn)場(chǎng)維護(hù)流程。ELS方案的弊端在于功耗更高。如下方示意圖所示，基于ELS的系統(tǒng)中，輸出功率會(huì)因連接器損耗、光纖耦合損耗及調(diào)制器效率等因素在多個(gè)環(huán)節(jié)衰減。因此系統(tǒng)中每臺(tái)激光器必須提供24.5dBm的光功率,才能補(bǔ)償損耗并確保傳輸可靠性。高輸出激光器在熱應(yīng)力下會(huì)產(chǎn)生更多熱量并加速退化，其中激光器和熱電冷卻器占約70%的ELS功耗。盡管激光器設(shè)計(jì)、封裝和光路方面的漸進(jìn)改進(jìn)有所幫助，但激光器高功耗需求的問(wèn)題尚未完全解決。在今年的VLSI大會(huì)上，英偉達(dá)重點(diǎn)介紹了其生態(tài)系統(tǒng)中的多家激光器合作伙伴：Lumentum提供單高功率DFB激光器，AyarLabs提供DFB陣列，Innolume提供量子點(diǎn)鎖模梳，Xscape、Enlightra和Iloomina則提供泵浦非線性諧振梳。英偉達(dá)同時(shí)探討了探索垂直腔面發(fā)射激光器（VCSEL）陣列作為潛在替代方案的可能性。盡管單纖數(shù)據(jù)速率較低且可能存在散熱問(wèn)題，但VCSEL在功率和成本效率方面具有優(yōu)勢(shì)，適用于"寬帶低速"應(yīng)用場(chǎng)景。不過(guò)我們認(rèn)為這并非英偉達(dá)當(dāng)前的優(yōu)先事項(xiàng)。CPO現(xiàn)狀、挑戰(zhàn)與解決方案波分復(fù)用（WDM）是指通過(guò)同一根光纖傳輸多個(gè)不同波長(zhǎng)（或稱波長(zhǎng)）的光信號(hào)。WDM主要分為兩種常見(jiàn)類型：粗波分復(fù)用（CWDM）和密集波分復(fù)用（DWDM）。CWDM通常承載較少通道且間隔較寬（典型間隔20納米而DWDM則以極窄間隔（常小于1納米）密集排列大量通道。CWDM較寬的通道間隔限制了其容量，而DWDM的窄間隔可容納40、80甚至超過(guò)100個(gè)通道。WDM技術(shù)至關(guān)重要，因?yàn)楫?dāng)前多數(shù)CPO方案的實(shí)現(xiàn)受限于可連接至光引擎的光纖數(shù)量。有限的光纖對(duì)意味著必須最大化利用每對(duì)光纖。當(dāng)激光進(jìn)入PIC時(shí)，會(huì)經(jīng)歷調(diào)制階段（由驅(qū)動(dòng)器驅(qū)動(dòng)將電子信號(hào)編碼為激光波長(zhǎng)。該過(guò)程主要采用三種調(diào)制器：馬赫-曾德?tīng)栒{(diào)制器（MZM）、微環(huán)調(diào)制器（MRM）和電吸收調(diào)制器（EAM）。每個(gè)獨(dú)立波長(zhǎng)（單個(gè)光通道上的特定波長(zhǎng)）均需配備獨(dú)立調(diào)制器。馬赫-曾德?tīng)栒{(diào)制器（MZM）MZM通過(guò)將連續(xù)波光信號(hào)分裂為兩條波導(dǎo)臂來(lái)編碼數(shù)據(jù)，這兩條臂的折射率可通過(guò)施加電壓進(jìn)行調(diào)節(jié)。當(dāng)臂重新結(jié)合時(shí)，其干涉圖案會(huì)調(diào)制信號(hào)的強(qiáng)度或相位。來(lái)源：LucedaAcademy在三種調(diào)制器中，MZM最易實(shí)現(xiàn)且熱敏性低，減少了精密溫控需求。其高線性度支持PAM4和相干QAM等先進(jìn)調(diào)制格式（盡管QAM不適用于HPC/AI工作負(fù)載）。MZM的低頻移特性可提升高階調(diào)制與長(zhǎng)距離傳輸?shù)男盘?hào)完整性。該技術(shù)還支持更高通道帶寬：?jiǎn)瓮ǖ?00G傳輸已實(shí)現(xiàn)，采用非相干PAM調(diào)制時(shí)單通道400G傳輸亦被認(rèn)為可行。然而MZM的缺點(diǎn)在于：大型器件尺寸以毫米為單位（相較于微米級(jí)別的MRM因其需要兩個(gè)波導(dǎo)臂和一個(gè)組合波導(dǎo)（因此包含在OEPIC中）。MZM尺寸約為100納米。區(qū)域，消耗更多芯片面積并限制了前沿信息收錄的密度：因此通道）包含在OEPIC中。MZM尺寸約為~12,000平方毫米2，EAM尺寸約為250平方毫米2（5×50毫米而MRM尺寸介于25平方毫米2至225平方毫米2之間（直徑5-15平方毫米2）。這是MZM的關(guān)鍵缺陷之一，可能限制其縮放能力。然而，若將調(diào)制器周邊的驅(qū)動(dòng)器及光電控制電路納入考量，形成完整的PIC/EIC組合時(shí)，MZM尺寸劣勢(shì)的顯著性可能有所降低。高功耗問(wèn)題在于相位移過(guò)程需要消耗大量能量。其偏置條件（即啟動(dòng)電壓）也高于MRM(后者在亞伏特級(jí)電壓下工作）。不過(guò)像Nubis這樣的公司正致力于開(kāi)發(fā)巧妙的設(shè)計(jì)方案，以彌補(bǔ)MZM在功耗方面的劣勢(shì)。在初創(chuàng)企業(yè)生態(tài)中，Nubis是主要采用MZM技術(shù)實(shí)現(xiàn)CPO解決方案規(guī)?；钠髽I(yè)之一。由于MZM器件體積龐大且波長(zhǎng)數(shù)量有限，該技術(shù)尚未在初創(chuàng)生態(tài)中廣泛普及。微環(huán)調(diào)制器（MRM）MRM采用緊湊型環(huán)形波導(dǎo)，與一條或多條直線波導(dǎo)耦合。電信號(hào)改變環(huán)形波導(dǎo)的折射率，從而改變其共振波長(zhǎng)。通過(guò)調(diào)節(jié)共振狀態(tài)使其與輸入光對(duì)齊或錯(cuò)位，MRM可調(diào)制光信號(hào)的強(qiáng)度或相位，從而實(shí)現(xiàn)數(shù)據(jù)編碼。光源從輸入端口進(jìn)入環(huán)形腔——對(duì)于大多數(shù)波長(zhǎng)的光，環(huán)形腔不會(huì)產(chǎn)生共振，因此光會(huì)直接穿過(guò)設(shè)備，從輸入端口到達(dá)輸出端口。若波長(zhǎng)滿足共振條件，光將在環(huán)形腔內(nèi)發(fā)生建設(shè)性干涉，從而被引導(dǎo)至分光端口。如下圖歸一化功率曲線所示，特定波長(zhǎng)的光會(huì)在分光端口產(chǎn)生傳輸功率的尖銳峰值，同時(shí)對(duì)應(yīng)地導(dǎo)致直通端口的傳輸功率驟降。此效應(yīng)可用于調(diào)制目的。光學(xué)引擎通常采用多個(gè)MRM，每個(gè)環(huán)形器均可調(diào)諧至不同波長(zhǎng)，從而實(shí)現(xiàn)基于環(huán)形器本身的波分復(fù)用（WDM無(wú)需額外設(shè)備即可完成波分復(fù)用功能。MRM具有以下關(guān)鍵優(yōu)勢(shì)：體積極為緊湊（尺寸級(jí)為數(shù)十微米可實(shí)現(xiàn)遠(yuǎn)高于MZM的調(diào)制器密度。MZM尺寸約為12,000mm2,EAM約為250mm2（5×50mm而MRM尺寸介于25mm2至225mm2之間（直徑5-15mm2環(huán)形器特別適用于波分復(fù)用（WDM）應(yīng)用（包括8波長(zhǎng)或16波長(zhǎng)的密集波分復(fù)用DWDM并具備內(nèi)置復(fù)用/解復(fù)用功能；MRM可實(shí)現(xiàn)高能效（單位比特功耗更低）；最后，環(huán)形天線具有低啁啾效應(yīng)，這能提升信號(hào)質(zhì)量。然而，MRM也存在若干挑戰(zhàn)：MRM的溫度敏感度可達(dá)MZM和EAM的10-100倍，需要設(shè)計(jì)和制造難度極高的精密控制系統(tǒng)；其非線性特性使PAM4/6/8等高階調(diào)制方案復(fù)雜化；MRM的靈敏度與嚴(yán)苛的溫度控制公差使得標(biāo)準(zhǔn)化困難重重，因每種設(shè)計(jì)均有精確要求。在解決方案供應(yīng)商中，英偉達(dá)對(duì)MRM展現(xiàn)出明顯偏好。該公司宣稱率先設(shè)計(jì)并將MRM應(yīng)用于CPO系統(tǒng),認(rèn)為其核心優(yōu)勢(shì)在于體積緊湊和低驅(qū)動(dòng)電壓，有助于降低功耗。但MRM技術(shù)也以控制難度高著稱,設(shè)計(jì)精度成為成功實(shí)施的關(guān)鍵——這恰恰是英偉達(dá)的優(yōu)勢(shì)所在。在制造工藝方面，臺(tái)積電先進(jìn)的CMOS技術(shù)專長(zhǎng)非常適合制造具有高精度和高品質(zhì)因子的MRM。此外，Tower公司也為其光子節(jié)點(diǎn)帶來(lái)了強(qiáng)大的制造能力。MRM的實(shí)現(xiàn)雖具挑戰(zhàn)性但完全可行，其潛在帶寬密度可超越MZM。正因如此，臺(tái)積電、英偉達(dá)及AyarLabs、Lightmatter、Ranovus等眾多光處理器公司都聚焦于此技術(shù)路線。電吸收調(diào)制器（EAM）電致變色材料通過(guò)改變其吸收光的能力來(lái)調(diào)制信號(hào)，這種能力取決于施加的電壓。更具體地說(shuō)，當(dāng)?shù)碗妷夯驘o(wú)電壓施加于電致變色材料時(shí)，該器件允許大部分入射激光光線通過(guò)，使其呈現(xiàn)透明或"開(kāi)啟"狀態(tài)。當(dāng)施加更高電壓時(shí)，GeSi調(diào)制器的帶隙會(huì)向高C波段范圍（1500nm以上）偏移，從而提高該波段的吸收系數(shù)，并衰減（"關(guān)閉"）通過(guò)鄰近波導(dǎo)的光信號(hào)。此現(xiàn)象被稱為弗蘭茨-凱爾迪什效應(yīng)。這種在"開(kāi)"與"關(guān)"狀態(tài)間的切換可調(diào)制光強(qiáng)，從而將數(shù)據(jù)有效編碼至光信號(hào)中。來(lái)源：德克薩斯農(nóng)工大學(xué)，劉2008，赫爾曼如今，采用電吸收調(diào)制激光器（EML）進(jìn)行調(diào)制的收發(fā)器也遵循相同原理。通過(guò)將連續(xù)波（CW）分布式反饋（DFB）激光器與基于InP的EAM耦合，可構(gòu)建單個(gè)離散EML以調(diào)制單條通道。例如，800GDR8收發(fā)器在8條獨(dú)立光纖通道上使用8個(gè)EML，每通道采用PAM4調(diào)制（2位/信號(hào)）并以約56GBaud速率傳輸。與基于GeSi的調(diào)制器不同，InP調(diào)制器的帶隙對(duì)應(yīng)于O波段（1310nm該波長(zhǎng)是所有數(shù)據(jù)通信DR光器件的標(biāo)準(zhǔn)波長(zhǎng)，從而實(shí)現(xiàn)了高度的互操作性。砷化銦調(diào)制器存在若干缺點(diǎn)，使其在CPO中的應(yīng)用不夠理想。砷化銦晶圓尺寸通常較?。?英寸或6英寸且良率較低——這兩點(diǎn)因素導(dǎo)致基于砷化銦的器件單價(jià)遠(yuǎn)高于硅基器件，后者可采用8英寸或12英寸工藝制造。此外，砷化銦與硅的耦合難度遠(yuǎn)高于鍺硅與其他硅器件的耦合。與磁阻調(diào)制器（MRMs）和微腔調(diào)制器（MZIs）相比，電致發(fā)光調(diào)制器（EAMs）具有以下優(yōu)勢(shì)：顯然——無(wú)論是電致發(fā)光分子（EAMs）還是磁致發(fā)光分子（MRMs都具備控制邏輯和加熱器以抵御溫度波動(dòng)，但EAMs在溫度敏感性方面具有根本性優(yōu)勢(shì)。相較于MRM，EAM在50°C以上具有顯著更優(yōu)的熱穩(wěn)定性，而MRM對(duì)溫度極為敏感。MRM典型穩(wěn)定性為70-90pm/°C，意味著2°C溫差將導(dǎo)致0.14nm的共振位移——遠(yuǎn)超MRM性能崩潰的臨界值0.1nm。反之，EAM可承受高達(dá)35°C的瞬時(shí)溫度變化。這種耐受性對(duì)CelestialAI的技術(shù)尤為關(guān)鍵——其EAM調(diào)制器置于中介層電源內(nèi)。電源模塊中。EAM還可耐受約80°C的高環(huán)境溫度范圍，這適用于緊鄰XPU而非置于其下方的芯片應(yīng)用場(chǎng)景。與MZI相比，EAM尺寸更小且功耗更低，因?yàn)镸ZI相對(duì)較大的尺寸需要高電壓擺幅，需要放大器將SerDes信號(hào)放大至0-5V擺幅。馬赫曾德調(diào)制器（MZM）尺寸約為12,000平方毫米，電子調(diào)制器（EAM）約為250平方毫米（5x50毫米），磁阻調(diào)制器（MRM）尺寸在25平方毫米至225平方毫米之間（直徑5-15平方毫米）。MZI還需消耗更多功率來(lái)驅(qū)動(dòng)加熱器，以使如此大的器件保持所需的偏置。另一方面，采用GeSiEAM進(jìn)行CPO存在若干局限：基于硅或氮化硅的物理調(diào)制器結(jié)構(gòu)（如MRM和MZI）被認(rèn)為具有遠(yuǎn)高于鍺硅基器件的耐用性和可靠性。誠(chéng)然，鑒于鍺基器件的加工與集成難度，許多人擔(dān)憂其可靠性。但Celestial公司指出，基于鍺硅的電致發(fā)光調(diào)制器（本質(zhì)上是光探測(cè)器的反向結(jié)構(gòu)）在可靠性方面具有確定性——這得益于當(dāng)今收發(fā)器中光探測(cè)器的廣泛應(yīng)用。GeSi調(diào)制器的帶邊自然位于C波段（即1530nm-1565nm）。設(shè)計(jì)量子阱以將該特性轉(zhuǎn)移至O波段（即1260-1360nm）是極具挑戰(zhàn)性的工程難題。這意味著基于GeSi的EAM調(diào)制器很可能僅適用于封閉式CPO系統(tǒng)，難以融入開(kāi)放式芯片生態(tài)系統(tǒng)。相較于成熟的O波段連續(xù)波激光器生態(tài)系統(tǒng)，圍繞C波段激光器構(gòu)建生態(tài)可能面臨規(guī)模不經(jīng)濟(jì)問(wèn)題。多數(shù)數(shù)據(jù)通信激光器針對(duì)O波段設(shè)計(jì)，但Celestial指出1577nmXGS-PON激光器存在龐大生產(chǎn)規(guī)模，這類激光器通常應(yīng)用于家庭及企業(yè)光纖接入場(chǎng)景。硅鍺EAM插入損耗約為4-5dB，而MRM和MZI均為3-5dB。MRM可直接實(shí)現(xiàn)多波長(zhǎng)復(fù)用，而EAM需額外配置復(fù)用器才能實(shí)現(xiàn)CWDM或DWDM，這會(huì)略微增加潛在損耗預(yù)算。總體而言，在當(dāng)前的CPO實(shí)現(xiàn)中，EAMs尚未得到廣泛應(yīng)用，CelestialAI作為少數(shù)積極探索此方法的公司之一尤為突出。當(dāng)前可用的光引擎通常提供1.6T至3.2T的總帶寬。英偉達(dá)的QuantumCPO包含1.6T引擎，其Spectrum版本計(jì)劃采用3.2T規(guī)格。博通展示了適用于Bailly平臺(tái)的6.4T光引擎，但其體積龐大（寬度達(dá)英偉達(dá)產(chǎn)品的2-3倍且需占用兩個(gè)FAU插槽，因此帶寬密度可能與英偉達(dá)產(chǎn)品相當(dāng)。Marvell的光引擎同樣存在此類情況。6.4TOE需要2個(gè)FAU，因此占用較大空間。據(jù)我們所知，Marvell的OE近期也不會(huì)應(yīng)用于任何生產(chǎn)系統(tǒng)。來(lái)源：SemiAnalysis正如我們所討論的，NvidiaSpectrum-X光子交換機(jī)中采用的3.2T光引擎方案，其岸線帶寬密度并未超越基于長(zhǎng)距離SerDes驅(qū)動(dòng)的可插拔模塊。換言之，光引擎密度必須實(shí)現(xiàn)數(shù)倍級(jí)提升，才能帶來(lái)顯著的性能優(yōu)勢(shì)并推動(dòng)客戶采用。這意味著需要同時(shí)提升主機(jī)芯片與光引擎EIC之間的電接口性能，并擴(kuò)大光纖傳輸帶寬。但如果我們能夠自由設(shè)計(jì)下一代互連技術(shù)，那么解鎖當(dāng)前及未來(lái)世代更大帶寬的方法會(huì)有哪些？讓我們探討基于共封裝光引擎的帶寬擴(kuò)展關(guān)鍵方案：1.繼續(xù)采用基于電氣SerDes的物理層設(shè)計(jì)：通過(guò)使用短距離（SR）SerDes替代長(zhǎng)距離SerDes，實(shí)現(xiàn)更簡(jiǎn)化的設(shè)計(jì)實(shí)施、更小的面積占用和更低的功耗。但最終仍將受限于電氣接口處的SerDes速度——該領(lǐng)域的發(fā)展空間已趨近極限。此處的思路是采用過(guò)渡方案，使硅片設(shè)計(jì)師無(wú)需重構(gòu)I/O架構(gòu)。此外，采用電信號(hào)SerDes可靈活兼容現(xiàn)有可插拔光模塊和/或銅纜，實(shí)現(xiàn)同一硅片的多模態(tài)適配。2.采用寬I/O物理層接口（如UCIe以較低波特率（例如56G）配合NRZ調(diào)制運(yùn)行。這種方案對(duì)光引擎的EIC要求較低，甚至可能消除

人人文庫(kù)> 全部分類> 行業(yè)資料 > 各類標(biāo)準(zhǔn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

共封裝光學(xué)器件（CPO）手冊(cè)-以光為介質(zhì)實(shí)現(xiàn)下一代互連技術(shù)擴(kuò)展

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

共封裝光學(xué)器件（CPO）手冊(cè)-以光為介質(zhì)實(shí)現(xiàn)下一代互連技術(shù)擴(kuò)展

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔