C114訊 10月17日消息(水易)“天下苦英偉達久矣”!這樣的呼聲隨著AI的飛速發展愈發高漲,特別是在擴大AI算力集群規模時,InfiniBand、NVLink雖然性能卓越,但封閉的生態、高昂的成本以及供應商鎖定帶來的斷供風險,促使行業巨頭尋求更開放、靈活且具成本效益的替代方案。
近年來,相繼涌現的超以太網聯盟(Ultra Ethernet Consortium, UEC)、全調度以太網技術GSE(Global Scheduling Ethernet)等,都致力于通過開放、標準,擁有成熟軟硬件生態的以太網方案,助力AI基礎設施建設。
不止于此,2025年OCP全球峰會期間,ESUN(Ethernet for Scale-Up Networking)聯盟亮相,從命名就能看出,這是面向AI智算中心Scale-Up場景的協議規范,目標挑戰AI集群內部被專有協議壟斷的高速互聯市場。

值得關注的是,在ESUN聯盟成員中,有專有協議的受益者英偉達,也有互為競爭對手的博通和思科、AMD和英偉達,還有互為客戶關系的互聯網廠商和設備商。這樣的組合不僅耐人尋味,同時沒有一家中國廠商參與,也讓我們感受到中美AI生態存在分裂的可能性,為此中國的AI產業鏈也應該加快協作,共建開放生態,推動人工智能持續發展。
ESUN:目標Scale-Up以太化
AIGC的爆炸式增長和快速演進帶來了復雜的訓練和推理工作負載,不斷推高計算節點之間的通信量,任何網絡延遲或帶寬瓶頸都會導致昂貴的GPU空閑等待,大幅降低整體計算效率。
研究數據顯示,在智算中心整體投資中,網絡僅占10%,但網絡性能波動可導致訓練效率下降30%,訓練時長增加25%。基于Scale-Up的超節點技術可以實現單機柜更高密度GPU的直接互聯通信,將充分提升算力卡的計算效能,減少GPU閑置,顯著提升訓推效率。
從大型AI算力基礎設施建設的技術方向看,超節點已經成為主導性產品形態,并正在成為AI基礎設施建設的新常態。超節點事實上就是一臺能學習、思考、推理的計算機,物理上由多臺機器組成,但邏輯上以一臺機器學習、思考、推理。
當然,這就對Scale-Up網絡提出極為嚴苛的要求,超大帶寬、極低時延、超高可靠等都是基本條件,也在一定程度上解釋了為什么市面上的超級點的方案幾乎都是專有協議。但問題也隨之而來,深度綁定帶來成本居高不下,生態碎片化形成一座座算力孤島,制約了AI產業的持續創新發展。
面對這一局面,整個AI產業鏈一直在討論基于擁有成熟軟硬件生態的以太網方案來進行智算網絡創新,統一智算聯接標準。只不過,以太網在無損傳輸、錯誤處理等核心指標上存在一定短板。如今,ESUN聯盟的成立,匯聚產業鏈龍頭協同推進,使得這件事情有了確定性的未來。
從OCP官網的介紹來看,ESUN本質是OCP框架下的開放式技術協作平臺,致力于將以太網技術適配并升級至AI Scale-Up場景。簡言之,ESUN的目標是基于以太網方案,為數量巨大的AI芯片互聯提供統一的“語言”,為高密度AI計算集群打造高性能、可互通的連接基石,并向所有人開放。
開放開源:AI全產業鏈受益
開放一直是“開放計算項目(OCP)”的初衷,ESUN作為一個開放論壇,運營商、設備和組件制造商可以在此共同推進針對Scale-Up網絡優化的以太網解決方案,強調XPU網絡接口和以太網交換機芯片的開發和互操作性。
ESUN最初的工作重點將放在L2/L3以太網幀結構和交換機制,實現魯棒、無損和抗錯誤的單跳和多跳拓撲。同時,ESUN將積極與UEC(超以太網聯盟)和IEEE 802.3工作組接洽,以與開放標準對齊,吸納最佳實踐,并加速創新。此外,利用以太網成熟的硬件和軟件生態系統,推動其在行業內的快速采用。
值得一提的是,ESUN僅聚焦于開放基于標準的以太網交換和幀格式,并明確排除了主機側協議棧、非以太網協議、應用層解決方案及專有技術方案。
AI產業鏈積極擁抱開放開源有其底層邏輯。對于互聯網廠商,基于以太網無與倫比的成熟度,通過開放設計能打破廠商鎖定,降低成本的同時,實現靈活擴展。對于解決方案供應商而言,開放標準降低創新門檻,加速產品上市,也能豐富供應鏈。
英偉達雖然受益于封閉生態,但面對整個AI產業的開放開源大潮必須跟進,也要在表面上消除“壟斷”的標簽。與此同時,英偉達在以太網領域的實力同樣強勁,IDC最新報告顯示,2025年Q2英偉達以太網交換機業務收入同比暴增647%,達到23億美元,在數據中心細分市場中以25.9%的份額躍居第一,超越傳統巨頭思科與Arista。
在OCP期間的發言中,AMD執行副總裁兼首席技術官Mark Papermaster明確表示開放生態的重要性,“協作”不只是成功要素,更是根本條件,歷史證明最終總是開放生態勝出。事實上,回顧信息通信行業的高速發展,很大程度上得益于整個互聯技術向以太化統一,這也是標準統一帶來的魅力。
協同共進:開放AI產業生態
如前文所述,ESUN聯盟匯聚的十二家企業包括AMD、Arista、ARM、博通、思科、HPE、Marvell、Meta、微軟、英偉達、OpenAI、甲骨文,清一色的美國企業,沒有一家中國企業參與其中,這幾乎是當前中美科技博弈持續升溫背景下的常態。
與此同時,美國對高端GPU的出口管制,中國AI產業鏈和生態的割裂將會進一步加劇。為了在這一輪的AI競賽中不掉隊,我們也需要探索出適合中國發展的技術方案,并加速開放開源,靈衢UnifiedBus已經給出答案。
早在2024年華為全聯接大會上,華為副董事長、輪值董事長徐直軍提到“開創計算架構,打造‘超節點+集群’算力解決方案持續滿足算力需求”。今年的全聯接大會上,華為正式發布靈衢UnifiedBus,一個面向超節點的互聯協議。
據了解,基于靈衢 1.0 的Atlas 900超節點自2025年3月開始交付,至今已商用部署300多套,靈衢1.0技術得到充分驗證。在靈衢1.0的基礎上,華為繼續豐富功能,優化性能,提升規模,進一步完善了協議,形成了靈衢2.0,并規劃了Atlas 950 SuperPoD和Atlas 960 SuperPoD的超節點產品。
徐直軍還宣布,華為全面開放靈衢2.0技術規范。華為堅持硬件開放、軟件開源,支持伙伴打造面向行業的超節點場景化解決方案,加速開發者高效自主創新,推動超節點技術普惠與協同創新,共建繁榮生態。
當然,AI產業生態的發展除了某個廠商的貢獻外,更需要華為、阿里云、字節、騰訊云、運營商等產業鏈頭部企業的協作,形成合力。同時也離不開生態社區的指引,例如近年來中國移動主導的GSE、中國信通院主導的ODCC等社區,都在為產業生態建設提供有力支撐。









































