在數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)演進(jìn)中,帶寬的提升始終是永恒的主題。近年來(lái),隨著云計(jì)算、大數(shù)據(jù)分析以及人工智能訓(xùn)練的普及,南北向流量(用戶(hù)到服務(wù)器)與東西向流量(服務(wù)器間通信)同時(shí)呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。作為光潤(rùn)通科技的網(wǎng)絡(luò)工程師,我們?cè)谂c客戶(hù)的交流中發(fā)現(xiàn),很多企業(yè)在規(guī)劃網(wǎng)絡(luò)升級(jí)時(shí),往往面臨一個(gè)核心問(wèn)題:到底是該選擇成熟的萬(wàn)兆方案,還是直接跨越到25G/100G?
這個(gè)問(wèn)題沒(méi)有標(biāo)準(zhǔn)答案,但可以通過(guò)分析業(yè)務(wù)負(fù)載特征來(lái)找到最優(yōu)解。
萬(wàn)兆的瓶頸并非只在速率本身
首先需要澄清一個(gè)常見(jiàn)的誤區(qū):萬(wàn)兆不夠用了,不單純是因?yàn)閹挃?shù)字上的差距。更深層的原因在于,現(xiàn)代數(shù)據(jù)中心的存儲(chǔ)架構(gòu)正在發(fā)生根本性變化。傳統(tǒng)的存儲(chǔ)區(qū)域網(wǎng)絡(luò)正在被NVMe-oF(NVMe over Fabrics) 所替代。NVMe協(xié)議本身的低延遲特性,要求底層的網(wǎng)絡(luò)傳輸必須能夠匹配SSD的極速響應(yīng)能力。
當(dāng)一臺(tái)服務(wù)器試圖通過(guò)萬(wàn)兆網(wǎng)絡(luò)訪問(wèn)遠(yuǎn)程N(yùn)VMe盤(pán)時(shí),網(wǎng)絡(luò)本身的延遲會(huì)成為整個(gè)I/O路徑上的短板。這就好比給高速公路配了一個(gè)窄小的收費(fèi)站,無(wú)論車(chē)輛性能多好,最終都要在收費(fèi)口排隊(duì)。此時(shí),升級(jí)到25G甚至100G網(wǎng)絡(luò),帶來(lái)的不僅僅是車(chē)道數(shù)量的增加,更是端到端延遲的大幅降低。
25G的物理層優(yōu)勢(shì):SerDes技術(shù)的演進(jìn)
從技術(shù)實(shí)現(xiàn)的角度來(lái)看,25G并非簡(jiǎn)單的速率提升,它得益于SerDes(串行解串器)技術(shù)的代際升級(jí)。早期的萬(wàn)兆網(wǎng)絡(luò)通常采用10Gbps的單通道速率。而25G網(wǎng)絡(luò)則基于25Gbps的單通道速率,通過(guò)一根通道(25G)或四根通道聚合(100G)來(lái)實(shí)現(xiàn)。

這種單通道速率的提升,帶來(lái)的是更高的端口密度和更低的功耗。在同樣的物理空間內(nèi),25G網(wǎng)卡能夠處理比萬(wàn)兆多1.5倍的流量,而功耗卻增加有限。對(duì)于數(shù)據(jù)中心運(yùn)營(yíng)者而言,這意味著PUE(電能使用效率)的優(yōu)化和機(jī)柜部署密度的提升。
實(shí)際部署中的平滑演進(jìn)策略
那么,企業(yè)應(yīng)該如何規(guī)劃升級(jí)路徑?光潤(rùn)通科技基于大量客戶(hù)的部署經(jīng)驗(yàn),總結(jié)出兩種主流模式。
第一種是核心-匯聚層先行。對(duì)于資金充裕、業(yè)務(wù)增長(zhǎng)預(yù)期明確的大型數(shù)據(jù)中心,可以直接在核心交換層面部署100G互聯(lián),服務(wù)器接入層則采用25G網(wǎng)卡。這種架構(gòu)的優(yōu)勢(shì)在于,核心網(wǎng)絡(luò)一次到位,后續(xù)擴(kuò)容只需增加接入層設(shè)備即可。
第二種是利舊與兼容模式。對(duì)于預(yù)算有限的中小型企業(yè),可以考慮采用支持25G下行+100G上行的TOR(機(jī)柜頂部)交換機(jī)。服務(wù)器端的光潤(rùn)通25G網(wǎng)卡,目前均設(shè)計(jì)為支持向下兼容萬(wàn)兆模式。這意味著,企業(yè)可以分批次采購(gòu)設(shè)備,先部署25G網(wǎng)卡連接現(xiàn)有的萬(wàn)兆交換機(jī),待網(wǎng)絡(luò)基礎(chǔ)設(shè)施升級(jí)時(shí)再釋放網(wǎng)卡的滿(mǎn)血性能。
不容忽視的細(xì)節(jié):PCIe通道的匹配
最后必須強(qiáng)調(diào)的是,部署25G/100G網(wǎng)卡,一定要審視服務(wù)器的PCIe資源。一張雙端口的25G網(wǎng)卡,其雙向理論吞吐量接近100Gbps。這需要服務(wù)器插槽提供至少PCIe 3.0 x8或PCIe 4.0 x4的帶寬。如果插入的是PCIe 3.0 x4的插槽,網(wǎng)卡就會(huì)因?yàn)橥ǖ啦蛔愣鵁o(wú)法發(fā)揮全部性能。光潤(rùn)通在每一款高速網(wǎng)卡的產(chǎn)品手冊(cè)中,都明確標(biāo)注了推薦的插槽規(guī)格,建議用戶(hù)在安裝前務(wù)必核對(duì)服務(wù)器主板的手冊(cè),避免硬件資源錯(cuò)配。
從萬(wàn)兆到25G乃至100G的升級(jí),不是簡(jiǎn)單的設(shè)備更換,而是一場(chǎng)需要通盤(pán)考慮的計(jì)算與網(wǎng)絡(luò)協(xié)同優(yōu)化。光潤(rùn)通科技致力于提供從10G到100G的全系列光纖網(wǎng)卡解決方案,助力企業(yè)根據(jù)自身業(yè)務(wù)節(jié)奏,規(guī)劃最經(jīng)濟(jì)、最高效的升級(jí)路徑。