DPU:“劫機”服務器生態(tài)

2022-10-07    分類: 網站建設

DPU全稱是 data processing unit,在云計算技術和產品里出現(xiàn)時間也有幾年了,包括AWS的Nitro(注意不是智能網卡ENA,ENA對應的是Mellanox的CX-5等),不過大部分云廠商都是用于自己云平臺上,只是最近NVIDIA CEO Jensen Huang對其DPU產品BlueField-X的介紹和產品發(fā)布視頻導致了一股討論熱潮。

DPU:“劫機”服務器生態(tài)

BlueField-2圖例

那么到底什么是DPU?通過以下幾點對DPU即同類型設備的幾點特征做如下解釋:

1)DPU是一塊完整的板卡,這塊卡有獨自的CPU,而且不是類似原來嵌入式設備的MIPS等性能不高的CPU,通常是ARM等服務器同類型的CPU;并且這塊卡還有獨立的內存、磁盤、網卡及可配置GPU等增強設備,并且有獨立的BMC和OS,即如果不看物理形態(tài),完全是一臺體積小的服務器;

2)DPU設備工作時,是附錄在通用服務器上作為附屬設備來使能,通過PCI設備與所屬Host進行交互信息;并且在Host OS來看,DPU設備是透明的,但是提供的網路、存儲、安全等能力是可見的;

3)DPU設備的啟動/重啟對所屬Host有依賴,二者的OS相互獨立但是有控制信息傳遞和數(shù)據信息的交互(通過PCI接口);相比智能網卡,完全在所屬主機Host內可視并且可控;

4)如前面提及的,不少人認為DPU是智能網卡或智能網卡的增強版,個人并不這么認為;一方面是DPU要比智能網卡的能力全的多(包括有網絡能力、存儲能力、安全能力等),再一個是智能網卡的驅動通常是在所在主機內而DPU完全不需要任何驅動,最后DPU有獨立的CPU和OS而智能網卡僅是驅動設備;所以DPU是一種全新的軟件定義基礎設施的設備(Software-Defined Infrastructure),而不是已有網卡設備的增強版;

通過上面幾點,我們可以得到DPU可以提供的幾點能力:

1)提供為所屬主機的網絡處理能力、存儲處理能力和安全處理能力,并且這些能力可以使用DPU的OS的軟件棧來實現(xiàn),也可以通過智能網卡或安全設備實現(xiàn)網絡處理能力、存儲處理能力和安全處理能力的硬件卸載,以提升處理性能;比如NVIDIA的BlueField-2就集成了ConnectX-6提供200G的以太網或IB處理能力,并且實現(xiàn)了虛擬交換機卸載;

DPU:“劫機”服務器生態(tài)

2)DPU類型的設備所用CPU可以是前面提及的ARM,技術上講也可以是其他能力匹配的CPU比如X86等,但是產品化要考慮性能、功耗、產品體積、主機插槽等各方面影響;

3)DPU類型的設備比如類似AWS的Nitro卡,也可以提供hypervisor的能力,對BMS和EC2實例提供一致的產品架構和特性能力,這點對于BMS產品實現(xiàn)尤其重要,這里可以參考阿里的神龍相關說明;

4)DPU類型設備提供了服務器“異構”的生態(tài)自主構建能力,比如X86的服務器上,可能很多比如Mellanox(已被NVIDIA 收購)的網卡、英偉達的GPU可以很方便的在X86上通過標準的PCI標準提供相應的能力,而無需再直接和X86 主板CPU產生關聯(lián);這就使得其他廠商給服務器的主機CPU外圍提供更多能力構建的通道,并且不會和主機CPU產生綁定和依賴,也同時“繞開”了主機CPU廠商設置的“門檻”。

所以結合上面的內容,我們看下DPU的出現(xiàn)會給業(yè)界帶來什么?

1)從技術上來說,可以通過主機外面附加DPU設備使得大化Host資源使用率,這樣通過DPU的廉價性使能在比如云計算場景有更多的主機CPU可以銷售,也為提供更大規(guī)格單EC2實例甚至BMS提供了方案,而更多的主機CPU出售意味著主機數(shù)沒有增加而銷售產品數(shù)量增加了;并且使用DPU的智能網卡等硬件卸載提升網絡能力和存儲能力,以及加解密安全能力;而DPU設備對于主機的透明性,增加了云計算主機被入侵后的擴散隔離能力;

2)從商業(yè)上講,以DPU對于NVIDIA為例,NVIDIA產品中網卡、GPU外設可以不再受Host主板/板載約束,因為如前面所述,DPU設備通過PCI標準通信,實現(xiàn)了CPU算力的逐步搶占,即可以在維持客戶數(shù)據中心已有X86設備的基礎上來疊加NVIDIA的設備能力,并且逐步蠶食這塊算力市場,從而構建NVIDIA在數(shù)據中心整體能力建設,最終實現(xiàn)數(shù)據中心全NVIDIA的“設備全棧”目標;以突破比如intel CPU板載網卡必須是本廠商的限制;

3)從趨勢上講,DPU設備對于主機Host來說,使得主機具有了更多“智能化”,雖然原來服務器通常有管理職能化(BMC),但是接口標準性、接口性能、功能豐富度一直存在不足,而DPU設備對于數(shù)據中心硬件設備的SDN(Network Defined Software)、SDS(Network Defined Storage)之后的SDC(Network Defined Compute)最后一環(huán)提供了一種實現(xiàn),相比原來純虛擬化內容的SDC,最終實現(xiàn)了能力加設備的智能管控,即前面提及的SDI能力;

4)DPU設備的出現(xiàn),解決了數(shù)據中心服務器設備尤其是在云場景下帶來的一些問題,為數(shù)據中心的智能化又實現(xiàn)了重要的一環(huán);但是對于當前來說,如果X86服務器的CPU主機使用了NVIDIA的DPU之后,導致CPU的板載網卡處于無用之地,也給整體設備采購成本、采購流程帶來了影響,并且DPU選型需要考慮到市場和客戶因素;

5)從整體運行的系統(tǒng)性來講,原來單主機允許的故障范圍,擴大到DPU設備和CPU主機,二者之一有故障就會帶來整體的損壞,可靠性和穩(wěn)定性角度是有下降的,畢竟“沒有免費的午餐”,想獲得收益就得有付出,只是這個代價是否是客戶可以接受的。

6)DPU畢竟也屬于一款硬件產品,其研發(fā)不僅包括了CPU,還有網卡、OS等,所以對于基于DPU進行所謂自主和服務器設備自身研發(fā)不會存在太多差異,甚至還有因為設備體積限制等帶來更多制造精度的要求,因此DPU的制造可以當做服務器集成來做,技術上還是有很多可以從服務器商借鑒的;也因此,如果說一款DPU類型的設備全是創(chuàng)業(yè)公司自研,那這個自研說法的可信度也自然就值得懷疑;

總之而言,DPU設備提供了較多的實用能力,也有NVIDIA等廠商對產品的定位和市場考慮,但是說“數(shù)據中心基礎架構”也只能當做廠商自己目標的宣傳語看待,還沒到必要的程度;并且從DPU的市場來看,主要用于云計算場景,而云計算大廠商基本都會有自己自研設備或設備合作定制;DPU產品之路,且行且看路,因為這條路真不寬。

文章題目:DPU:“劫機”服務器生態(tài)
鏈接URL:http://www.muchs.cn/news24/203174.html

成都網站建設公司_創(chuàng)新互聯(lián),為您提供外貿建站微信公眾號、軟件開發(fā)、關鍵詞優(yōu)化、網站策劃、面包屑導航

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

手機網站建設