四虎永久免费网站_高清一区二区三区日本久_欧美日韩在线中文字幕_久久天天狠狠_成人18精品视频_黄色av网站在线_在线视频观看一区二区_欧美国产一区二区_天天插天天色_欧美日韩国产综合在线

資訊
`
2025/11/18 13:30

異構算力新格局:從英偉達 Rubin CPX 與昇騰 950PR 看互聯趨勢

0
0

自 2024 年起,大模型研發重心逐步從單純的預訓練轉向高質量的推理。如今,模型不僅要“會看”,更要“會想”。以 OpenAI 的 o1 為代表的一批推理模型,通過多步推理顯著降低錯誤率,宣告了“推理時代”的到來。2025 年初,DeepSeek 的問世將這一趨勢進一步放大。DeepSeek 通過多項工程與算法創新——包括 MOE(多專家并行)、多 pipeline 流水線掩蓋,以及 MLA(Multi-head Latent Attention)低秩壓縮以降低 KVcache 數據量——有效緩解了大規模推理的瓶頸,顯著提升訓練與推理性能,降低使用成本,從而成為普適大模型的典型代表。

在 RAG 等技術的推動下,推理正朝長序列輸入方向演進;與此同時,從事單純預訓練的廠商數量明顯減少,行業競爭焦點正在向“高效、低成本的推理能力”聚攏。誰能在最短時間內以最低成本獲得更高的推理收益,誰就能掌握智算市場的“屠龍刀”,贏得更大的市場與利潤空間。AI 的未來將由推理驅動,而推理的勝負,取決于誰能把性能做到極致并把成本壓到最低。把握這一點,就是把握未來智算市場的話語權。

AI集群推理對算力基礎設施的要求

提到推理的基礎設施,就不得不提Prefill與Deocde分離部署方式,我們先來了解下什么是prefill和decode。

● Prefill(預填充)階段:處理用戶的全部輸入,將相關信息寫入 KV cache,并生成第一個 token。每個推理任務中,Prefill 只執行一次。

● Decode(解碼)階段:以自回歸方式逐步生成后續 token。舉例:若輸出序列長度為 1024,則 Prefill 產生第 1 個 token,Decode 需執行剩余的 1023 次生成操作。

Prefill階段的特征是計算密集(Compute bound)型 ,需要遍歷模型所有層進行前向計算,大量矩陣乘法使得算術強度(FLOP/Byte)很高。GPU/加速卡的算力利用率通常可達 80%–90%,而 HBM(片上高帶寬內存)訪問相對較少,帶寬利用率僅為個位數百分比,帶寬并不是瓶頸。因此可通過減少 HBM 帶寬或容量,采用更低成本的 HBM 來降低總體成本。

Semianalysis 對HBM的成本有詳細的分析,如下圖1所示:在NVL72的GB300中,HBM成本占比高達61%,在計算密集型的prefill階段,HBM有大量的時間都處于空閑狀態,這是對昂貴的HBM的資源極大浪費!

圖片 1.png

圖1 : HBM成本占比

而Decode階段的特征是訪存密集(memory bound)型,每生成一個 token 都需從 HBM 拉回 KV(通常為幾十 MB)到芯片處理單元(SM),帶寬利用率可達 70%–90%。Decode 階段頻繁進行 batch 組建與 KVcache/參數讀取,因此訪存帶寬直接決定了延遲與吞吐,成為關鍵性能瓶頸。

因此,在實際部署中將 Prefill 和 Decode 分別放到不同類型的硬件節點(例如“算力節點”與“帶寬節點”)可以顯著提升整體吞吐并降低延遲;算力節點(Compute optimized):為 Prefill 提供高 FLOPS、較低 HBM 要求的硬件配置,降低成本。帶寬節點(Memory optimized):為 Decode 提供大帶寬、高容量的 HBM,消除訪存瓶頸,提升單 token延遲和吞吐。 下圖2為微軟&華盛頓大學研究成果,通過PD分離,實現推理性能的大幅提升(吞吐提升240%),而成本基本上沒有變化

圖片 2.png

圖2 : 微軟&華盛頓大學PD分離部署研究結果

英偉達 Rubin CPX:為 Prefill 而生,推理成本迎來新拐點

2025年9月9日,在英偉達 AI 基礎設施峰會上,英偉達推出了一款專為 Prefill 階段設計的 GPU——Rubin CPX。英偉達超大規模與高性能計算副總裁 Ian Buck 在發布會上進行了介紹(官方活動頁:https://www.nvidia.com/en-us/events/ai-infra-summit/),Rubin CPX 面向的是日益增長的長輸入序列場景,英偉達計劃于 2026 年底將其推向市場。下圖3是Rubin CPX與英偉達主流算力卡的對比,針對 Prefill 階段的特點(計算密集、帶寬需求低),Rubin CPX 做出了幾項調整:FP4 峰值算力約 20P,約為 R200 的 2/3 左右,將昂貴的 HBM 替換為更低成本的 GDDR7,顯存從 288GB 縮減到 128GB。

圖片 3.png

圖3:英偉達不同系列GPU芯片對比

其中變化最為明顯的是顯存的類型發生了變化,我們在前面章節提到,prefill階段是計算密集型的,訪存的次數比較少,使用昂貴的HBM會造成資源的閑置浪費,通過將顯存切換為價格更為便宜的GDDR,降低訪存帶寬,進一步降低了prefill階段的硬件成本,而性能基本不會有損失。除了顯存替換外,CPX 還取消了 NVLink 和 NVSwitch 等用于大規模 scale up 的互聯硬件,從而進一步壓縮了擴展成本。

Rubin CPX 提供兩種機框配置形式(圖4):單框 144 個 CPX,以及 144 個 CPX 與 72 個 R200 組合同框。在這些配置中,CPX 更依賴于 scale out(橫向擴展)網絡來連接各個芯片,而不是傳統的高成本 scale up 互聯。

圖片 4.png

圖4:英偉達機架服務器介紹

這意味著在未來的推理集群架構中,低成本的 scale out 網絡將變得愈發重要:通過橫向擴展并結合合理的調度策略,能在保持吞吐的同時壓低總體擁有成本(TCO)。

與 Rubin CPX 同路:昇騰950PR 的算力帶寬平衡策略

華為全聯接大會 2025 上,徐直軍發布了 Ascend 950PR/950DT 以及 Ascend 960、970 系列產品。其中,Ascend 950PR 是專為 Prefill 階段設計的算力卡,其設計思路與英偉達的 Rubin CPX 非常接近——通過有針對性的資源配比來降低 Prefill 的硬件成本。相較于面向更廣泛場景的 950DT(HBM 帶寬 4 TB/s),950PR 將顯存帶寬降至 1.6 TB/s,HBM 容量從 144 GB 縮減到 128 GB,進一步降低了Prefill階段的成本。未來,通過scale-out網絡連接950PR服務器形態,組成Prefill集群,進一步降低scale-up互聯成本,會是一個比較好的選擇。

圖片 5.png

圖5:華為發布昇騰950系列產品

異構算力是未來趨勢,推動scale-out網絡升級

昇騰 950PR 與英偉達 Rubin CPX 在思路上高度一致——在 Prefill 場景下犧牲部分帶寬和顯存容量,換取更低的硬件成本與更高的性價比。由此可見,按推理階段選用不同算力卡已成為明顯趨勢——例如將 CPX/950PR 用于 Prefill階段,把 R200/950DT 或 Cloud Matrix 384 用于 Decode階段。

實際上,某大型互聯網公司已經實現異構算力部署:用 NVIDIA 卡構建 Prefill 資源池、用超節點(高帶寬實例)構建 Decode 資源池。Prefill 階段獲得高算力密度并降低擴展成本;Decode 階段依靠超節點提供低延遲和大帶寬,滿足對實時性(TPOT)越來越苛刻的要求。華為云的研究論文也給出相似方案(如圖6):用昇騰 A2服務器 做 Prefill、昇騰CloudMatrix384超節點做 Decode,以在推理場景中實現更優的性價比。

圖片 6.png

圖6:《 xDeepServe: Model-as-a-Service on Huawei CloudMatrix384》

當前英偉達在算力上仍然領先,但國產 XPU(如昇騰、寒武紀、摩爾線程)正在快速崛起,形成百花齊放的格局。不同算力卡各擅所長,組合異構節點可以在成本與性能間取得更好平衡。在這種架構下(圖7),scale out 網絡需要承載大量 KV cache 和模型參數等流量,這對scale-out網絡也提出了新的要求:

(1)多種速率與接口兼容:需要支持 200G/400G/800G 接入,甚至同時承載存儲流量,未來可能還會復用 XPU 網卡以獲得更低延遲與更高帶寬。

(2) 無阻塞、高可靠的通信:異構算力間的通信模式復雜,網絡必須保證無阻塞通信,解決負載均衡、擁塞頭阻等問題,避免影響推理延遲與吞吐。

圖片 7.png

圖7:異構算力互聯架構

異構算力浪潮來了,scale-out網絡準備好了嗎?

C114中國通信網版權說明:凡注明來源為“C114通信網”的文章皆屬C114版權所有,除與C114簽署內容授權協議的單位外,其他單位未經允許禁止轉載、摘編,違者必究。如需使用,請聯系021-54451141(汪先生)。其中編譯類僅出于傳遞更多信息之目的,系C114對海外相關站點最新信息的翻譯稿,僅供參考,不代表證實其描述或贊同其觀點,投資者據此操作,風險自擔;如有翻譯質量問題請指正

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯系我們     網站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網版權所有 舉報電話:021-54451141 用戶注銷

亚洲综合免费观看高清在线观看| 成人在线观看视频网站| 欧美激情一区二区三区| 一个色综合网| 欧美激情福利| 午夜视频在线观看网站| 特级丰满少妇一级| 国产在线98福利播放视频| 国产亚洲欧美视频| 91久久精品日日躁夜夜躁欧美| 波多野洁衣一区| 国产精品五区| 精品国产乱码久久久久久蜜坠欲下| 麻豆网站免费在线观看| 欧美另类极限扩张| 色啪啪.com| 少妇喷水在线观看| 精品不卡一区二区| 粉嫩精品久久99综合一区| 波多野结衣国产精品| 日韩精品一区二区三区四 | 手机在线播放av| 国产免费一区二区视频| 久久久久久欧美精品色一二三四| 97色在线观看免费视频| 一区二区欧美久久| 欧美成人乱码一区二区三区| 午夜精品爽啪视频| 日本一区二区三区在线不卡| 国精产品一区一区三区mba视频| 欧美精品播放| 欧美大片aaaa| 国产成人手机高清在线观看网站| 4438五月综合| 亚洲成人不卡| 久草在线资源福利站| 蜜芽tv福利在线视频| 免费福利影院| 2019天天操夜夜操| 日本成址在线观看| 国产在线观看不卡一区二区三区| 无码国产精品一区二区色情男同| 国产精品伦一区二区三区| 永久免费无码av网站在线观看| 亚洲国产美女视频| 国精产品久拍自产在线网站| 久久成人激情视频| 亚洲人人夜夜澡人人爽| 乱码一区二区三区| 欧美日韩一区二区区| 国产女同无遮挡互慰高潮91| 国产精品v日韩精品v在线观看| 日本三级免费网站| 欧美成人xxxxx| 1024精品视频| 老司机午夜av| av在线无限看| 手机免费av片| 亚洲性图第一页| 97精品人人妻人人| 免费a v网站| 最新中文字幕视频| 99久久精品免费视频| 久久久久亚洲av成人无码电影| 国产老熟女伦老熟妇露脸| 97香蕉碰碰人妻国产欧美| 麻豆精品国产传媒av| 手机在线看片日韩| 亚洲一区二区三区蜜桃| 影音先锋制服丝袜| 国产主播av在线| 青娱乐国产在线| 欧美亚洲精品天堂| 国产一区二区三区视频免费观看| av中文在线观看| 亚洲成人在线电影| 国产精品天美传媒入口| 黄色动漫网站| a√免费观看在线网址www| 最近97中文超碰在线| wwwxxx在线观看| 成人影院在线播放| 国产成人77亚洲精品www| 中文字幕日韩高清在线| 欧美一站二站| 一本色道精品久久一区二区三区| 蜜臀av国产精品久久久久| 国产99久久久久| 国产拍揄自揄精品视频麻豆| 亚洲国产裸拍裸体视频在线观看乱了 | www成人在线| 在线播放亚洲精品| 亚洲精品国产一区二| 桃花网日韩影视在线观看视频| 尤物视频在线观看网站| jizz国产| 欧美性videos| a屁视频一区二区三区四区| 97青娱国产盛宴精品视频| 日韩伦理视频| 日本欧美久久久久免费播放网| 成人av电影在线观看| 亚洲中国最大av网站| 69堂精品视频| 久久久精品一区二区三区| 国产精品久久久久秋霞鲁丝 | 久久香蕉国产线看观看av| 欧美一级免费看| 久久精品国产精品青草色艺| 男人天堂手机在线视频| 亚洲综合中文网| 五月天丁香激情| 欧美一区二区三区四区在线观看| 99国产高清| 中文字幕你懂得| 久久亚洲欧美| 久久99精品久久久久子伦| 国产一级黄色| 99re热视频精品| 青青青在线视频免费观看| 久久久精品国产| 国产精品自拍视频| 视频二区一区| 国产理论在线播放| 日本污视频网站| 狠狠人妻久久久久久| 天堂在线资源库| 伊人av在线com| 一区二区三区视频在线观看视频| 一区在线影院| 一二三区不卡| 99r国产精品| 色94色欧美sute亚洲线路一久| 亚洲欧美激情在线视频| 国产精品成人一区| 在线观看欧美激情| 日韩精品视频网址| 国产一级二级三级视频| 天天插天天干天天操| 成视频免费在线看| 蜜桃av在线| 久久视频在线| 成人午夜电影久久影院| 欧美性jizz18性欧美| 中文字幕日韩欧美精品在线观看| 91亚洲精品一区| 国模吧无码一区二区三区| 国产又粗又猛又爽又黄的视频四季| 91女人18毛片水多国产| 嫩草影院视频| 亚洲七七久久综合桃花剧情介绍| 天海翼精品一区二区三区| 久久精品女人天堂| 亚洲视频在线观看一区| 精品一区二区三区电影| 91精品天堂| 中文字幕第80页| 99免费在线观看| 国产精品合集一区二区| 好吊日视频在线观看| 女仆av观看一区| 国产激情精品久久久第一区二区| 91国产免费观看| 久久久视频免费观看| 青青草免费在线视频观看| 制服 丝袜 综合 日韩 欧美| 亚洲va欧美va| 每日更新在线观看av| 2021年精品国产福利在线| 麻豆一区二区三区| 欧洲一区二区三区免费视频| 日本精品免费观看| 六月丁香激情网| 国产精品久久久久久久久久久久冷 | 99热成人精品热久久66| 黄色一级片在线免费观看| 欧美成人禁片在线观看网址| 国产一二区在线观看| 偷拍自拍亚洲色图| 99视频一区二区三区| 欧美一级国产精品| 99热在线播放| 污污污www精品国产网站| 日本黄色一区二区三区| 日本美女高清在线观看免费| 精品视频99| 国产精品久久久久久久午夜片 | 一区二区三区免费看视频| 久久精品视频在线播放| 亚洲免费视频播放| 欧美精品成人久久| 高清成人av| 精品一区二区三区中文字幕视频| 蜜桃av噜噜一区| 欧美精品一级二级三级| 亚洲已满18点击进入在线看片| 亚洲国产一区二区三区在线| 老熟妇高潮一区二区三区| 九色蝌蚪自拍| 日韩免费高清视频网站| 91美女蜜桃在线| xx视频.9999.com| 91免费黄视频| 国产在成人精品线拍偷自揄拍| 涩涩视频在线观看免费| 午夜精品视频一区二区三区在线看| 亚洲精品久久7777| 全球成人中文在线| 4438x全国最大成人| 亚洲 欧美 精品| √8天堂资源地址中文在线| 日韩高清电影一区| 日韩欧美国产午夜精品| 日本成人黄色| 日本一级片免费看| 97在线观看免费高清视频| 成人羞羞网站入口免费| 黄色成人av在线| 亚洲综合在线播放| 成年人网站在线观看视频| 福利地址发布页| 丝袜美腿综合| 欧美性猛xxx| 国产日韩在线一区二区三区| 欧美爱爱小视频| 色视频www在线播放国产| 国产电影一区二区在线观看| 欧洲生活片亚洲生活在线观看| 国产伦精品一区二区三| 欧美精品色哟哟| 污视频在线观看免费| 欧美私人啪啪vps| 日韩久久久久久| 国产爆乳无码一区二区麻豆| 国产手机精品视频| 99色在线观看| 91视频com| 91成人在线视频| 人妻在线日韩免费视频| 成年人网站在线观看免费| 精品国产乱子伦一区二区| 精品福利樱桃av导航| 国产视频99| 自拍偷拍欧美亚洲| 在线观看免费黄色| 青青草91视频| 日韩成人性视频| 亚洲 中文字幕 日韩 无码| 影音先锋中文字幕在线播放| 国产日韩欧美中文在线| 自拍偷在线精品自拍偷无码专区 | 亚洲二区中文字幕| 日本欧美黄色片| 一本久中文高清| 97久久精品| 精品美女永久免费视频| 日韩欧美一区二区在线观看| 7777久久亚洲中文字幕| 欧美极品影院| 亚洲黄色在线视频| 极品校花啪啪激情久久| 久久精品视频5| 888av在线视频| 欧美经典一区二区三区| 成人91视频| 青青国产在线视频| 九色porny视频在线观看| 国产精品麻豆一区二区| www日韩av| 在线观看不卡的av| 电影亚洲精品噜噜在线观看 | 91一区二区三区| 免费看毛片网站| 日韩欧美精品电影| 亚洲一区二区3| 在线看无码的免费网站| 亚洲爱爱天堂| 国产欧美久久一区二区三区| 亚洲第一区中文字幕| 黄色手机在线视频| 乱小说综合网站| 久久久噜噜噜| 2019中文在线观看| 91av在线免费视频| 成人av观看| 欧美日韩国产一中文字不卡| 日韩第一页在线观看| 欧美高清videos性极品| 亚洲激情五月| 日韩在线视频国产| 丁香六月激情综合| 中文在线免费| 亚洲精品国产精华液| 日韩欧美一级在线| 91成品视频入口| 香蕉久久a毛片| 欧美在线影院在线视频| 国产午夜性春猛交ⅹxxx| 欧洲av一区二区| 欧美日韩免费不卡视频一区二区三区 | 手机看片国产1024| 日本成人小视频| 中文字幕在线观看亚洲| av在线播放中文字幕| 青草视频在线免费直播 | 福利电影一区二区三区| 国产伦理久久久| 婷婷综合激情网| 天天超碰亚洲| 色综合久久悠悠| 久久久久久久久久影院| 日韩欧美激情电影| 亚洲成人在线网| 成人午夜剧场视频网站| 18videosex性欧美麻豆| 亚洲午夜久久久久中文字幕久| 国产免费毛卡片| www免费在线观看视频| 91在线小视频| 一区不卡视频| av高清在线观看| 国产精品99久久久久久似苏梦涵| 国产在线精品一区二区三区| 九九久久九九| 久久福利毛片| 国产欧美日韩在线播放| 精品一区二区三区免费站| 久久一区二区三区四区五区 | 欧美黄色一区二区三区| www.成人| 国产一区二区日韩精品欧美精品| 欧美日韩精品在线观看视频| 国产精品1区| 国产一区二区三区在线视频| 天堂网一区二区三区| 天天躁日日躁成人字幕aⅴ| 麻豆成人在线看| 91丨九色丨海角社区| 欧美国产美女| 国产精品高清在线观看| 天堂在线中文网| 国产精品腿扒开做爽爽爽挤奶网站| 97神马电影| 夜夜操免费视频| 丁香六月久久综合狠狠色| 一区二区三区国| 天堂视频福利| 亚洲精品视频一区二区| 国产精品自拍视频在线| 国产区在线看| 欧美日韩国产区一| 午夜国产小视频| 亚洲一区网址| 久久视频在线直播| 欧美一区二区激情视频| 第一sis亚洲原创| 国产精品爽黄69天堂a| 最近中文字幕mv免费高清视频8| 日本欧美大码aⅴ在线播放| 亚洲高清视频一区二区| 香港经典三级在线| 亚洲图片一区二区| 少妇一级淫免费观看| 久久91超碰青草在哪里看| 中文精品99久久国产香蕉| 亚洲无码精品在线观看| 一区精品久久| 欧洲一区二区日韩在线视频观看免费 | 精品国产一区二区三区久久久蜜臀 | 天堂av在线8| 密臀av在线播放| 原创国产精品91| 亚洲第九十九页| 美腿丝袜亚洲三区| 在线精品日韩| 成人免费在线视频网| 日韩精品一区二区三区三区免费| 日韩视频免费观看高清| 欧美一区在线看| 欧美激情论坛| 蜜桃免费在线| 日韩精品一区二区三区老鸭窝| 黄色在线观看国产| 亚洲三级影院| 中国黄色录像片| 免费黄色在线| 国产偷国产偷亚洲清高网站| 国产成人精品一区二区无码呦| 久久精品女人| 人人妻人人澡人人爽欧美一区双 | 国产欧美在线一区二区| 久久.com| 欧美性大战久久久久久久| 久久免费少妇高潮99精品| 欧美精品大片| 天堂av免费看| 成人在线观看亚洲| 一本一本久久a久久精品牛牛影视| 亚洲美女性生活| caoporm超碰国产精品|