在AI技術(shù)高速迭代的今天,從大模型訓(xùn)練到企業(yè)級數(shù)據(jù)湖倉,從智駕模型到醫(yī)療影像處理,存儲系統(tǒng)的性能、擴展性與場景適配能力已成為AI項目落地的關(guān)鍵支撐。面對市場上琳瑯滿目的AI存儲方案,技術(shù)決策者該如何選擇?本文將圍繞當前主流廠商的技術(shù)路線、核心優(yōu)勢及典型場景表現(xiàn)展開深度評測,為用戶提供選型參考。
深信服EDS:打通AI與傳統(tǒng)業(yè)務(wù)的統(tǒng)一存儲底座
深信服EDS作為面向主存儲的下一代分布式存儲,其定位與以容量或邊緣數(shù)據(jù)為主的Ceph系存儲形成鮮明差異。其核心價值在于“統(tǒng)一”——通過自研全對稱分布式架構(gòu),構(gòu)建可橫向擴展的存儲資源池;以NVMe/SATA SSD為高性能層、機械盤為大容量層,實現(xiàn)冷熱數(shù)據(jù)自動分層;同時提供塊(SAN)、文件(NAS)、對象(S3)統(tǒng)一存儲,面向AI采、標、訓(xùn)、推、歸檔全過程提供統(tǒng)一的數(shù)據(jù)存儲底座,一套存儲滿足AI模型開發(fā)全流程、多業(yè)務(wù)部門、多環(huán)境的存儲需求。
技術(shù)亮點:
一、在海量小文件處理方面,深信服通過巨量智能元數(shù)據(jù)能力,大幅提升元數(shù)據(jù)性能,加速AI數(shù)據(jù)準備
通過矩陣式算法,深信服EDS存儲可緩存元數(shù)據(jù)規(guī)模是Ceph系存儲的7倍,大幅提高元數(shù)據(jù)命中率;通過自研元數(shù)據(jù)庫PhxKV,相較于開源通用KV數(shù)據(jù)庫(MongoDB等)提升50%以上,并支持元數(shù)據(jù)處理能力橫向擴展;并通過目錄HASH的方式將目錄請求打散分布到各個MDS 上,充分發(fā)揮各個節(jié)點的計算性能,實現(xiàn)MDS多并發(fā)和元數(shù)據(jù)服務(wù)的橫向擴展能力。
二、在解決GPU饑餓方面,深信服通過全局IO動態(tài)整合,以超高吞吐和IOPS,大幅提高GPU利用率
動態(tài)讀寫緩存:根據(jù)業(yè)務(wù)比例動態(tài)調(diào)整讀寫緩存大小,保障最優(yōu)的IO性能。
IO智能排序整理:深信服EDS存儲將寫IO在性能層進行智能排序整理后再追加寫入容量層,解決容量使用超過80%時GC垃圾 回收擠占導(dǎo)致性能下降問題。
介質(zhì)親和寫:深信服EDS存儲通過數(shù)據(jù)聚合后追加寫,解決小文件放大導(dǎo)致的空間浪費問題,并可充分利用機械盤順序?qū)懙男阅軆?yōu)勢,提升數(shù)據(jù)回寫性能。
三、自研高性能文件系統(tǒng)、架構(gòu)創(chuàng)新、高可靠性設(shè)計,大幅提高AI建設(shè)的ROI
EDS的全自研“鳳凰高性能文件系統(tǒng)”配合NVMe高速介質(zhì)與RDMA低時延網(wǎng)絡(luò),實現(xiàn)了媲美高端陣列的小文件讀寫性能(極限場景下穩(wěn)定運行)與大文件吞吐能力;全對稱分布式架構(gòu)支持百PB級容量與性能的獨立線性擴展,性能層與容量層可獨立擴容且業(yè)務(wù)無感知;內(nèi)建智能防病毒、硬盤健康預(yù)測等主動防護機制,提前規(guī)避故障風(fēng)險;軟硬解耦設(shè)計擺脫硬件綁定,邏輯資源池可分鐘級創(chuàng)建并自動納管新增磁盤/節(jié)點,顯著降低TCO
總結(jié):深信服的統(tǒng)一存儲既能滿足AI等新興應(yīng)用的需求,又能滿足傳統(tǒng)業(yè)務(wù)的需求,一套存儲打破時代和需求鴻溝,滿足各類業(yè)務(wù)需求。
華瑞指數(shù)云ExponTech:存算分離的性能標桿
華瑞指數(shù)云ExponTech的核心技術(shù)路線是“存算分離”,其硬件采用F2026 AI服務(wù)器(2U閃存JBOF),配備2/4個NVIDIA BlueField-3 DPU與24塊內(nèi)置硬件壓縮功能的ScaleFlux CSD5000 NVMe SSD,搭配NVIDIA Spectrum-X交換機;軟件層則依托下一代分布式存儲平臺WADP(WiDE AI Data Platform),將后端運行于BlueField-3 DPU內(nèi),存儲網(wǎng)關(guān)和協(xié)議部署在計算節(jié)點DPU內(nèi)。
性能表現(xiàn):單計算節(jié)點帶寬近90GB/s(接近網(wǎng)卡物理上限),310萬IOPS,且IOPS與DPU數(shù)量線性擴展(最大支持8張DPU,性能翻倍);小IO時延僅266μs,大IO時延<1ms。在MLPerf Storage v1.0測試中,其單客戶端支持GPU數(shù)量全球第一,存儲帶寬近30GB/s(全球第二);SPC-1評測更打破了高端全閃存儲紀錄。
核心優(yōu)勢:存算分離設(shè)計讓存儲與計算節(jié)點可獨立水平擴展,性能與容量等比例增長;ScaleFlux CSD5000 SSD的盤內(nèi)透明壓縮技術(shù)提升了存儲效率,配合高密度存儲(當前2U節(jié)點裸容量>1.6PB,2026年擴展至>6.6PB)與軟件定義架構(gòu),大幅降低TCO;RoCE動態(tài)路由與負載均衡技術(shù)則保障了大規(guī)模RDMA組網(wǎng)下的高效帶寬與低抖動。
適用場景:AI訓(xùn)練、推理集群及數(shù)據(jù)中心大規(guī)模存算分離場景,尤其適合對存儲性能、擴展性要求極高的千卡級以上GPU集群。
極客天成極客追光:國產(chǎn)化適配的靈活之選
極客追光全閃一體機以RDMA技術(shù)為底座,支持分布式并行文件存儲(NVFile)、塊存儲(NVMatrix)、對象存儲(NVObject),采用全內(nèi)核態(tài)軟件架構(gòu)(數(shù)據(jù)交換在內(nèi)核態(tài)完成),部署方式靈活(純軟件或2U軟硬一體方案,24塊NVMe SSD)。
性能指標:其速度達120GB/s,是業(yè)界最快存儲方案之一;全內(nèi)核態(tài)架構(gòu)減少了用戶態(tài)與內(nèi)核態(tài)的切換開銷,進一步優(yōu)化了數(shù)據(jù)處理效率。
核心優(yōu)勢:適配國產(chǎn)CPU(鯤鵬、海光、飛騰)與GPU(國產(chǎn)卡、寒武紀),支持國產(chǎn)化替代;Share Nothing架構(gòu)無需依賴一體化硬件,可適配不同客戶的現(xiàn)有硬件設(shè)備;數(shù)據(jù)冷熱自動分級功能實現(xiàn)了業(yè)務(wù)無感知的自動化數(shù)據(jù)流動,顯著降低運維成本。
適用場景:數(shù)據(jù)實時分析、深度學(xué)習(xí)、AI藥物研發(fā)、大模型訓(xùn)練等需要國產(chǎn)化適配的場景,已在金融、醫(yī)療、電信等領(lǐng)域的千卡GPU訓(xùn)練集群中落地。
京東云云海存儲:多模型兼容的穩(wěn)定派
京東云云海存儲以“高自研率+全場景覆蓋”為特色,代碼自研率98.9%(未依賴開源庫),支持國產(chǎn)硬件(CPU、GPU、主板、SSD等)適配與信創(chuàng)環(huán)境兼容。在24塊NVMe SSD配置下,其讀/寫帶寬達95GB/s/60GB/s,IOPS 280萬,單路4k讀寫延遲0.5ms,400GB IB網(wǎng)絡(luò)帶寬利用率84%(接近理論極限)。
核心優(yōu)勢:適配DeepSeek、ChatGPT、LLaMA等20余種主流大模型,技術(shù)儲備覆蓋從電商高并發(fā)到超算中心、大模型訓(xùn)練的全場景;服務(wù)100+大型企業(yè)(汽車、銀行、零售等),無服務(wù)中斷記錄,穩(wěn)定性經(jīng)市場驗證。
適用場景:大模型訓(xùn)練/推理、企業(yè)數(shù)據(jù)湖倉一體化、智駕模型訓(xùn)練(支持百個GPU計算節(jié)點高并發(fā)訪問),尤其適合需要多模型兼容與長期穩(wěn)定服務(wù)的企業(yè)級用戶。
選型建議:場景適配是關(guān)鍵
AI存儲方案的選擇沒有“絕對最優(yōu)”,需結(jié)合具體場景需求:
○ 追求極致性能與擴展性:華瑞指數(shù)云ExponTech的存算分離架構(gòu)與線性擴展能力更適合千卡級以上AI訓(xùn)練集群;
○ 國產(chǎn)化替代需求:極客天成極客追光的全內(nèi)核態(tài)架構(gòu)與國產(chǎn)軟硬件適配能力是首選;
○ 多模型兼容與穩(wěn)定性:京東云云海存儲在企業(yè)級場景中表現(xiàn)更均衡;
○ 打通AI與傳統(tǒng)業(yè)務(wù):深信服EDS的統(tǒng)一存儲底座能同時滿足新興AI與穩(wěn)態(tài)業(yè)務(wù)需求,降低資源割裂與運維成本。
無論選擇哪類方案,建議用戶先梳理自身工作負載特征(如訓(xùn)練/推理場景、數(shù)據(jù)規(guī)模、AI框架),再通過廠商測試驗證實際性能,最終選擇最適配的方案。









































