C114訊 9月17日消息(顏翊)9月11日,第26屆中國國際光電博覽會同期舉行的“超萬卡智算集群新型光技術發展論壇”上,海思光電子有限公司總監梁亦鉑發表題為《Copper or Fiber?AI DC的高速互聯方案選擇》的主題演講,探討了AI時代下數據中心互聯技術的發展方向。

梁亦鉑指出,當前大型智算中心必須依賴大量光互聯實現跨機柜、跨系統的高效連接,即便是目前采用電互聯方案的領先廠商,在構建更大規模集群時也必將轉向光方案。
數據中心互聯技術三大趨勢
梁亦鉑認為,當前,數據中心互聯技術存在三大趨勢。
首先,過去光通信行業主要由電信運營商驅動。當前,OTT成為了投資主力,運營商逐步掉隊。他引用LightCounting數據指出,當前全球頂級OTT企業的營收和資本支出已全面超越傳統通信運營商。無論是收入還是基礎設施投入,騰訊、阿里、Meta、Google等云廠商已成為光通信產業的核心驅動力。
第二,在AI驅動下,數據中心正從“以網絡為中心”向“以計算為中心”轉變。在AI智算中心,網絡的角色發生根本變化——不再只是連接工具,而是計算總線的延伸。其流量特征為持續滿帶寬、高吞吐、低時延,帶寬利用率普遍超過80%,且對誤碼和閃斷近乎零容忍。一次萬卡集群的訓練回滾,經濟損失可達300萬元。這種嚴苛要求決定了AI數據中心必須依賴更可靠、確定性的光互聯底座。
是光模塊廠商向中國聚集,但高端芯片仍受制于人。據LightCounting統計,2025年全球前十大光模塊廠商中,中國企業占據7席,彰顯封裝集成能力的全球領先地位。然而,多數國產廠商的底層核心芯片仍嚴重依賴進口,尤其是來自美國的Coherent、Cisco、Marvell等公司。值得欣慰的是,國內產業界已意識到這個問題。越來越多的光模塊企業開始向上游延伸,布局自研芯片。目前,國內已在56G及以下速率實現光電芯片自主可控。
在這樣的技術演進與產業變革背景下,光互聯已成為中美在全球AI競爭中角力的重要一環。
中美AI全鏈條呈“雙雄并立”
AI競爭的本質并非單一技術點的比拼,而是整個技術鏈條的系統性較量。梁亦鉑將其歸納為三大要素——算力、模型與應用。
算力方面,盡管受限于先進工藝獲取,我國在單芯片性能(如GPU制程、HBM帶寬等)上仍落后于美國,但通過系統級創新,尤其是光互聯技術的優勢,華為等企業已實現超大規模集群的系統能力反超。事實表明,AI集群無法僅靠“銅互連”擴展,大規模組網必須依賴光互聯,“光進銅退”是必然趨勢。
模型方面,中美差距正快速縮小。斯坦福數據顯示,美國大模型領先優勢從2023年的31.6%收窄至2024年的3.7%。以DeepSeek為代表的開源模型不僅性能強勁,且顯著降低訓練對算力的需求,推動行業“輕量化訓練、重化推理”轉型,削弱了對高端GPU的依賴,也促使部分企業放棄重復研發,轉向基于開源模型二次創新。
應用方面,中國在AI Agent領域展現出更強活力。MINIMAX、flowith等企業在人機交互、情感陪伴、任務執行等場景表現突出。相比美國主推B端SaaS模式,中國更擅長C端突破與垂直行業融合,依托龐大用戶數據和應用場景,在用戶體驗與商業模式上具備獨特優勢。
綜上,盡管底層算力存在短板,但憑借系統補強、模型開源與應用突圍,中國已在AI全鏈條形成與美國“雙雄并立”的競爭格局。
光不貴,也并非不可靠
針對業界長期存在的兩大誤解,梁亦鉑特別作出澄清:一是“光貴”是誤解。雖然光模塊單價高于銅纜,但在整個AI數據中心成本結構中,服務器占比超80%,光互聯整體成本不足10%。讓一個占比不到10%的部件承擔主要降本壓力,并不合理。
二是“光不可靠”實為運維問題。數據顯示,AI集群中29%的光鏈路故障中,64.7%由端面污染引起,僅9.3%為模塊本體失效。梁亦鉑表示,某些IT工程師把400G光模塊當網線插拔,揣口袋里再裝回去,但光纖端面極易污染,造成誤碼或中斷。這不是光模塊脆弱,而是操作不規范。一旦發生閃斷,排查耗時極長。
為應對超大規模集群挑戰,海思光電子推出兩大核心技術:一是StarSensor 星云智檢:支持分鐘級、厘米級全鏈路故障定位,可精準定位臟污、彎折、破損等問題,相較傳統壓測方案效率提升60倍,檢出率和準確率提高200%以上。
二是StarMatrix 星云光互聯解決方案:針對AI智算中心的特殊需求,海思光電子打造了專屬的光模塊產品體系:基于其自研芯片平臺,支持DSP直驅、去TC設計,在功耗、性能、傳輸距離上全面領先。目前,已在華為最新發布的384卡AI超節點系統中部署6912個基于該平臺的光模塊,全面支撐長周期、滿負載的大模型訓練任務。 








































