♦ 項目單位
中國電信股份有限公司北京分公司
♦ 項目背景
近一年企業算力需求年均增長率超過40%,尤其在AI融入核心生產后,訓練和推理算力需求顯著增長,但企業機房條件限制,自建算力難以滿足長期算力需求。很多企業傾向于租用算力以降低初始投資和專業服務,以租代建成為企業首選。租賃算力時企業數據出域的安全性是需要考慮的關鍵因素。算力靈活擴容和數據安全是企業租用算力的TOP關注點。傳統承載網絡難以滿足業務算力下沉帶來的快速接入和東西向流量增長需求及不同業務差異化的SLA要求,網絡丟包會直接導致算效顯著下降,甚至造成訓推業務中斷、服務不可用。
♦ 技術方案
北京電信基于新城完成智算廣域網基礎設施承載,面對全市高新產業的用算訴求,通過云邊協同分布式訓推解決方案解決企業用算要求,解決用算企業/行業數據安全不出域、算力靈活擴展、海量數據快速傳輸等關鍵需求。方案有幾大優勢:(1)企業側輕量化部署,算力擴容快:企業側只要部署小算力如訓推一體機,滿足企業AI應用需求,基于業務算力靈活擴容,應對推理/訓練算力需求。相比自建智算池綜合成本更優。(2)廣域RDMA無損網絡:高吞吐高彈性的廣域無損網絡,可提供差異化SLA保障算網一體服務新模式。(3)訓推數據安全,通過模型分層部署,云邊協同,網絡中只傳遞梯度值保護隱私。

♦ 創新點
在網絡解決方案創新方面,升級的智算廣域網具備原生算力業務高效承載的能力,通過Spine-Leaf的Full-Mesh組網優勢以及SRv6和FlexE+Flex-Channel切片等IPv6+核心技術,實現了企業到智算中心的租戶級小顆粒租戶級切片,實現無阻塞快速轉發和帶寬的彈性調整。當網絡中發生擁塞,智算路由器以租戶級為粒度對擁塞報文進行緩存,超過緩存水線時以租戶粒度向上一跳網絡設備發生反壓信號,直至到流量發送節點,從而保障租戶級的網絡擁塞不丟包,實現了超百公里RDMA無損傳輸。
在技術創新方面,融合了IPv6+與AI的前沿新技術,網絡通過RDMA無損、SPFC擁塞控制以及量子加密等,配合智算創新將模型分層切割在智算廣域網絡上只傳高維向量,保證原始數據不出域。

在算力模式創新方面,整合AI中臺、網絡運力、存儲與算力資源,提供算力+網絡的一體化服務,實現四個一落地:國內首個醫療行業 "邊云協同分布式算網" 方案落地案例!衛健行業首個 三甲醫院"AI中臺+智能體平臺" 落地 ,首個 "國家中心研究專病庫+專病協作網絡與國內首個"公立醫院運行管理大模型" 。向上游延伸激活智能算力、新一代網絡等技術創新,向下游拓展形成垂直行業算網一體服務。

♦ 應用效果及推廣前景
在商業應用方面:北京電信將醫院推理及訓練模型訓練任務拉遠至240公里外的武清智算中心,通過分層部署與無損網絡保障,實現算效損失小于5%。全程數據不出醫院園區,實現三方算力出租最高等級安全和彈性擴展,有效降低企業用算初期成本。
改方案通過彈性機制降低企業用算的邊際成本,北京電信依托成熟的網絡基礎設施,可為首都央國企、政教醫工提供算力專網,讓算力隨取隨用",全面提升數字經濟時代產業核心競爭力。 






































