網(wǎng)絡(luò),作為實(shí)現(xiàn)算力互聯(lián)的中樞神經(jīng),是構(gòu)建大規(guī)模智算系統(tǒng)的關(guān)鍵紐帶,也是決定海量算力資源能否被高效連接的核心要素。近日,元脈網(wǎng)絡(luò)正式發(fā)布全新算力互聯(lián)引擎——25.6T本土芯片智算交換機(jī)C400,該產(chǎn)品集安全可靠、開放靈活、智能運(yùn)維、極致性能、綠色節(jié)能于一身,解決了大規(guī)模算力系統(tǒng)在傳輸穩(wěn)定性、運(yùn)維效率、可靠性等方面的挑戰(zhàn),滿足智算中心、云數(shù)據(jù)中心等場(chǎng)景的傳輸需求,助推本土算力高質(zhì)量發(fā)展。

全新算力互聯(lián)引擎:賦能萬億級(jí)模型訓(xùn)練 有效訓(xùn)練時(shí)間提升8%
當(dāng)下,隨著AI算力規(guī)模的不斷擴(kuò)張,大模型訓(xùn)練在傳輸穩(wěn)定性和資源利用率上,面臨更為嚴(yán)苛的挑戰(zhàn)。元脈網(wǎng)絡(luò)此次推出的智算交換機(jī)C400,以“可靠、開放、智能”為核心理念,通過“超大規(guī)模算力系統(tǒng)互聯(lián)、動(dòng)態(tài)彈性負(fù)載、AI 級(jí)可靠保障”三大設(shè)計(jì),增強(qiáng)算力互聯(lián)效能,推動(dòng)產(chǎn)業(yè)新躍遷。
算力系統(tǒng)互聯(lián)層面,C400集成64個(gè)400G QSFP112 端口,最大可支持10萬卡規(guī)模組網(wǎng),輕松化解超大規(guī)模AI算力系統(tǒng)的部署需求,并為萬億級(jí)大模型訓(xùn)練奠定基礎(chǔ)。業(yè)務(wù)流量負(fù)載均衡方面,依托EMLB(彈性網(wǎng)絡(luò)負(fù)載均衡)技術(shù),可提供Flowlet與逐包轉(zhuǎn)發(fā)雙模式,實(shí)現(xiàn)流量智能分配,保障算力資源的高效均衡利用,規(guī)避單點(diǎn)過載問題,全面提升算力系統(tǒng)整體運(yùn)行效率。
根據(jù)第三方數(shù)據(jù)統(tǒng)計(jì)顯示,大模型訓(xùn)練過程中8%的意外中斷由光模塊/光纖故障引起。針對(duì)這一訓(xùn)練成本問題,元脈網(wǎng)絡(luò)通過深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)對(duì)光模塊/光纖健康度的預(yù)測(cè)與監(jiān)管。客戶可以在故障發(fā)生前進(jìn)行干預(yù)和糾正,規(guī)避由訓(xùn)練中斷引起的資源和時(shí)間浪費(fèi),有效提升訓(xùn)練時(shí)間,大幅增強(qiáng)AI訓(xùn)練的穩(wěn)定性和成功率。
極致可靠:核心元器件本土化 多重設(shè)計(jì)筑牢可靠防線
為了從底層構(gòu)建全面可靠的安全屏障,C400采用業(yè)界領(lǐng)先的25.6T本土交換芯片,及本土化的核心元器件,滿足客戶對(duì)信息安全和供應(yīng)穩(wěn)定的要求。同時(shí),元脈網(wǎng)絡(luò)從架構(gòu)、硬件、軟件三大維度對(duì)產(chǎn)品的可靠性進(jìn)行加固,為算力網(wǎng)絡(luò)的長(zhǎng)期穩(wěn)定運(yùn)行提供堅(jiān)實(shí)保障:
● 架構(gòu)極簡(jiǎn):產(chǎn)品整機(jī)采用固定端口的單主板架構(gòu)設(shè)計(jì),讓系統(tǒng)的穩(wěn)定性和可靠性更高。相較于插卡式方案,該架構(gòu)規(guī)避了主板和線卡之間的高速連接器、電源連接器等高發(fā)故障點(diǎn),同時(shí)減少了整機(jī)PCB板卡數(shù)量,全面降低系統(tǒng)整體故障率;
● 硬件加固:C400集成IGE智能防護(hù)功能,對(duì)關(guān)鍵部件進(jìn)行冗余備份,實(shí)現(xiàn)關(guān)鍵硬件的全面監(jiān)控與故障隔離。同時(shí),支持異常掉電保護(hù)和內(nèi)存糾錯(cuò)等多重故障預(yù)防機(jī)制,從硬件層面筑牢可靠性防線;
● 軟件增強(qiáng):軟件架構(gòu)層面,C400采用領(lǐng)先的SONiC容器化架構(gòu)設(shè)計(jì),實(shí)現(xiàn)功能模塊間的隔離運(yùn)行。并支持關(guān)鍵模塊熱重啟和熱升級(jí),確保軟件運(yùn)行不中斷,精準(zhǔn)適配AI網(wǎng)絡(luò)環(huán)境的高穩(wěn)定性需求。
開放靈活:三大開放組合方案 靈活適配多場(chǎng)景需求
開放網(wǎng)絡(luò)技術(shù)正以全球化的協(xié)作創(chuàng)新模式,推動(dòng)智算中心技術(shù)發(fā)展。SONiC作為開放網(wǎng)絡(luò)的代表,被譽(yù)為網(wǎng)絡(luò)領(lǐng)域的“Linux”,它的快速成長(zhǎng)為產(chǎn)業(yè)生態(tài)注入了新活力,帶動(dòng)硬件、系統(tǒng)軟件、業(yè)務(wù)應(yīng)用的快速迭代,為智算中心網(wǎng)絡(luò)業(yè)務(wù)的創(chuàng)新賦予無限可能。C400基于開放架構(gòu)設(shè)計(jì),實(shí)現(xiàn)了軟硬件的全面解耦。不僅支持元脈基于SONiC研發(fā)的 UXOS 操作系統(tǒng),還可兼容開源 SONiC 及其他第三方OS。
此外,為了深度契合不同行業(yè)、不同規(guī)模用戶的差異化需求,相較于閉源單一的商業(yè)模式,元脈網(wǎng)絡(luò)能夠提供更加靈活的三大組合方案:一是,對(duì)于具備自主研發(fā)能力的客戶,可以提供純硬件的交付方案,助力搭建貼合業(yè)務(wù)的網(wǎng)絡(luò)架構(gòu);二是,針對(duì)需要平衡研發(fā)效率與穩(wěn)定性的客戶,可以提供C400+SONiC的源碼級(jí)支持和交付服務(wù),降低開發(fā)成本;三是,對(duì)于追求“即插即用”的客戶,通過軟硬一體的TurnKey模式方案,實(shí)現(xiàn)快速交付。通過足夠冗余的商業(yè)模式,讓用戶擁有更加開放的選擇權(quán)。
智能運(yùn)維:RoCE網(wǎng)絡(luò)極速部署 毫秒級(jí)故障定位
在提高部署和運(yùn)維效率的設(shè)計(jì)思路上,C400支持RoCE網(wǎng)絡(luò)參數(shù)的一鍵最優(yōu)部署,通過自動(dòng)化和智能化的配置流程,減少RoCE網(wǎng)絡(luò)參數(shù)手動(dòng)調(diào)優(yōu)步驟,將部署調(diào)優(yōu)效率提升35%,有效縮短項(xiàng)目周期,幫助業(yè)務(wù)快速上線。
大模型訓(xùn)練需要海量數(shù)據(jù)持續(xù)交互,即使毫秒級(jí)的丟包也可能導(dǎo)致訓(xùn)練中斷、進(jìn)度回滾,造成算力資源浪費(fèi),這就要求網(wǎng)絡(luò)具備極致的故障感知和定位能力。C400的MoD監(jiān)測(cè)功能恰好完美匹配這一需求,既能快速感知故障,又能精準(zhǔn)鎖定問題根源,實(shí)現(xiàn)丟包事件的毫秒級(jí)定位,大幅縮短故障恢復(fù)時(shí)間,保障業(yè)務(wù)的穩(wěn)定運(yùn)行。
經(jīng)濟(jì)節(jié)能:能效更優(yōu) TCO降低50%
基于綠色節(jié)能的設(shè)計(jì)理念,C400采用phyless技術(shù),省去PHY芯片等高功耗有源器件。另外,通過極致調(diào)優(yōu)的散熱策略,在保障設(shè)備全場(chǎng)景散熱效率的前提下,顯著降低風(fēng)扇轉(zhuǎn)速。相較于市場(chǎng)同類型產(chǎn)品,整機(jī)功耗降低15%以上。
同時(shí),C400采用創(chuàng)新的“盒-盒組網(wǎng)”模式,可降低企業(yè)總體擁有成本(TCO)50%,大幅削減長(zhǎng)期能耗和運(yùn)維投入,幫助企業(yè)實(shí)現(xiàn)經(jīng)濟(jì)效益與可持續(xù)發(fā)展的完美平衡。
AI賦能未來 互聯(lián)構(gòu)筑基石
作為AI時(shí)代網(wǎng)絡(luò)創(chuàng)新引領(lǐng)者,元脈網(wǎng)絡(luò)可以為用戶提供面向AI時(shí)代的智算中心、數(shù)據(jù)中心、邊緣網(wǎng)絡(luò)等全棧網(wǎng)絡(luò)方案。并堅(jiān)持可靠、開放、智能的發(fā)展理念,持續(xù)深化自身在技術(shù)創(chuàng)新、場(chǎng)景創(chuàng)新、合作創(chuàng)新上的能力,為AI時(shí)代算力、數(shù)據(jù)價(jià)值的釋放,打造堅(jiān)實(shí)互聯(lián)基石。









































