近日,臨港算力(上海)科技有限公司(以下簡(jiǎn)稱(chēng)“臨港智算谷”)聯(lián)合國(guó)網(wǎng)上海電力、中國(guó)電信集團(tuán)研究院,成功落地“滬閩”AI百卡智算集群多任務(wù)跨省轉(zhuǎn)移項(xiàng)目。
這是國(guó)內(nèi)首次實(shí)現(xiàn)跨省(市)百卡算力集群的自動(dòng)化、高精度遷移技術(shù)驗(yàn)證。
初冬的上海臨港智算谷內(nèi),屏幕上“3分鐘”倒計(jì)時(shí)逐秒減少,104張華為910B算力卡正高速計(jì)算著三類(lèi)AI任務(wù)——語(yǔ)言大模型、打車(chē)策略模型、視頻智慧識(shí)別模型,正精準(zhǔn)“躍”至800公里之外的福建省福州市。

倒計(jì)時(shí)歸零!剎那間,算力節(jié)點(diǎn)成功連通,業(yè)務(wù)分毫未斷流,上海本地算力負(fù)荷同步驟降50千瓦,瞬時(shí)降幅達(dá)80%,一場(chǎng)無(wú)聲的算力“跨省接力”完美落定。
這一突破,是繼今年7月臨港智算谷首次將生產(chǎn)環(huán)境下的算力遷徙至湖北十堰后的升級(jí)跨越,標(biāo)志著中國(guó)電信算電協(xié)同技術(shù)正式從點(diǎn)對(duì)點(diǎn)試點(diǎn)邁向可商用、規(guī)模化應(yīng)用的新階段。
滬閩算力交互“近在咫尺”
曾經(jīng),傳統(tǒng)數(shù)據(jù)中心參與電網(wǎng)調(diào)度多依賴(lài)柴油機(jī)、UPS(不間斷電源)等硬件設(shè)施,靈活性和可持續(xù)性均有限,而此次滬閩百卡集群的遷移,則真正激活了算力本身的調(diào)節(jié)能力,讓其從單純的生產(chǎn)力轉(zhuǎn)變?yōu)殡娋W(wǎng)的調(diào)節(jié)力。
今年3月,臨港智算谷敏銳捕捉到國(guó)網(wǎng)上海電力調(diào)峰的需求,聯(lián)合中國(guó)電信研究院獲得政策和資源支持;7月,算力首遷湖北十堰驗(yàn)證其可行性;12月5日,實(shí)現(xiàn)首次滬閩百卡集群跨省遷移。

“整個(gè)過(guò)程就像搭積木,每一步都得扎扎實(shí)實(shí)。”臨港算力副總經(jīng)理姜鎏直言,項(xiàng)目能實(shí)現(xiàn)“秒級(jí)調(diào)控+分鐘級(jí)響應(yīng)”,核心是攻克了從算力任務(wù)組合、指令響應(yīng)到跨省轉(zhuǎn)移的全鏈路技術(shù),搭建起一套自動(dòng)化閉環(huán)調(diào)度體系,而這背后,靠的是五大關(guān)鍵技術(shù)環(huán)環(huán)相扣。
第一步便是筑牢“互聯(lián)互通的底座”,讓調(diào)度指令先跑通。上海側(cè)算力中心接入電力、算力雙內(nèi)網(wǎng),能精準(zhǔn)對(duì)接上海市級(jí)虛擬電廠(chǎng)平臺(tái)與電信“息壤——云霆”算力調(diào)度平臺(tái);福建側(cè)則提前備好匹配規(guī)格的算力資源,復(fù)刻與上海一致的任務(wù)運(yùn)行環(huán)境,讓AI任務(wù)遷移時(shí)“無(wú)縫銜接,不用重新適應(yīng)”。
第二步,便是再建一條“跨省高速”。依托中國(guó)電信跨省專(zhuān)線(xiàn),項(xiàng)目在電力與算力內(nèi)網(wǎng)間搭建安全API接口通道,低延遲、高帶寬的網(wǎng)絡(luò)保障,讓滬閩兩地算力數(shù)據(jù)傳輸“快且穩(wěn)”,為后續(xù)任務(wù)遷移掃清障礙。
如何實(shí)現(xiàn)“全鏈路貫通”?指令從上海市級(jí)虛擬電廠(chǎng)平臺(tái)出發(fā),經(jīng)上海電信虛擬電廠(chǎng)運(yùn)營(yíng)平臺(tái)核驗(yàn),再傳至“息壤——云霆”算力調(diào)度平臺(tái)執(zhí)行,全鏈路順暢銜接,確保調(diào)度指令“不卡頓、不跑偏”。
路跑通了,還需要一個(gè)“智能大腦”。基于Kubernetes(K8s開(kāi)源容器編排系統(tǒng))容器平臺(tái),算力任務(wù)能靈活部署、擴(kuò)縮容與遷移。“息壤——云霆”平臺(tái)會(huì)自動(dòng)核對(duì)指令,篩選出適合遷移的低時(shí)延推理任務(wù),生成轉(zhuǎn)移策略后,再定向引導(dǎo)業(yè)務(wù)流量到福建節(jié)點(diǎn)。
同時(shí),實(shí)時(shí)追蹤服務(wù)器功耗、GPU利用率等指標(biāo),一旦出現(xiàn)問(wèn)題,跨節(jié)點(diǎn)審計(jì)會(huì)自動(dòng)觸發(fā)回滾,保障業(yè)務(wù)“零中斷”。
“這不是一家企業(yè)能完成的事。”臨港算力(上海)科技有限公司雙碳事業(yè)部總監(jiān)袁瀟洋表示,國(guó)網(wǎng)上海電力提供成熟的電力調(diào)度體系,明確需求方向;中國(guó)電信研究院的“息壤——云霆”平臺(tái)奠定技術(shù)底座。三方各司其職、優(yōu)勢(shì)互補(bǔ),才讓算電協(xié)同從想法變成了現(xiàn)實(shí)。
調(diào)度周期結(jié)束后,業(yè)務(wù)需回到上海。臨港智算谷搭建了“回切高速恢復(fù)”機(jī)制,這也是最后一步。系統(tǒng)會(huì)自動(dòng)或按指令,將業(yè)務(wù)無(wú)感遷回上海原始數(shù)據(jù)中心,并快速進(jìn)入活躍狀態(tài),整個(gè)過(guò)程不影響使用。
從“AI底座”到“調(diào)峰電站”
在上海臨港智算谷園區(qū),成群機(jī)柜組成的算力集群正平穩(wěn)運(yùn)行,這里正是此次驗(yàn)證的“發(fā)源地”。臨港智算谷正在這里搭建涵蓋海陸雙節(jié)點(diǎn)的算力谷,向新征程邁進(jìn)。

上述基于臨港智算谷全量適配的算電協(xié)同技術(shù),根據(jù)上海電力測(cè)算,最多可降低8兆瓦負(fù)荷,相當(dāng)于為城市建起一座“數(shù)字調(diào)峰電站”,每年能減少數(shù)千噸碳排放。
能力背后,是臨港智算谷完善的基礎(chǔ)設(shè)施與技術(shù)儲(chǔ)備:這里不僅有充足的算力資源池,更有成熟的監(jiān)控體系、靈活的調(diào)度平臺(tái)與專(zhuān)業(yè)的運(yùn)營(yíng)團(tuán)隊(duì),能為不同行業(yè)提供從算力部署到運(yùn)維管理的全流程服務(wù)。
“未來(lái),我們將以此次滬閩百卡集群驗(yàn)證為起點(diǎn),進(jìn)一步納管更高量級(jí)負(fù)荷,擴(kuò)大跨域算力調(diào)度與電力調(diào)度協(xié)同響應(yīng)的范圍與技術(shù)適配范圍。”袁瀟洋透露,臨港智算谷計(jì)劃探索兆瓦級(jí)虛擬電廠(chǎng)響應(yīng)能力與海陸一體算電聯(lián)動(dòng)能力,持續(xù)強(qiáng)化在智算領(lǐng)域的領(lǐng)先優(yōu)勢(shì)。目前已啟動(dòng)與福建、湖北等省份的算力節(jié)點(diǎn)對(duì)接,計(jì)劃明年實(shí)現(xiàn)跨區(qū)域算力調(diào)度常態(tài)化,“讓每個(gè)智算中心都成為電網(wǎng)的‘彈性?xún)?chǔ)能單元’,這才是‘雙碳’目標(biāo)下的算力新生態(tài)”。
從支撐AI任務(wù)高效運(yùn)行,到參與城市電網(wǎng)調(diào)節(jié),臨港智算谷正推動(dòng)算力從“生產(chǎn)力”向“生產(chǎn)力+調(diào)節(jié)力”的雙重角色轉(zhuǎn)變,重塑算力中心核心價(jià)值。







































