數(shù)據(jù)中心服務(wù)器技術(shù)發(fā)展趨勢(shì)與應(yīng)用

2022-10-03    分類: 網(wǎng)站建設(shè)

在性能方面,人工智能(AI)應(yīng)用快速擴(kuò)張,要求IT云采用高性能GPU服務(wù)器。AI已在電信業(yè)網(wǎng)絡(luò)覆蓋優(yōu)化、批量投訴定界、異常檢測(cè)/診斷、業(yè)務(wù)識(shí)別、用戶定位等場(chǎng)景規(guī)?;瘧?yīng)用。AI應(yīng)用需求的大量出現(xiàn),要求數(shù)據(jù)中心部署的服務(wù)器具有更好的計(jì)算效能、吞吐能力和延遲性能,以傳統(tǒng)通用x86服務(wù)器為核心的計(jì)算平臺(tái)顯得力不從心,GPU服務(wù)器因此登上運(yùn)營(yíng)商IT建設(shè)的歷史舞臺(tái)。

數(shù)據(jù)中心服務(wù)器技術(shù)發(fā)展趨勢(shì)與應(yīng)用

在效率成本方面,IT云部署通用服務(wù)器存在弊端,催生定制化整機(jī)柜服務(wù)器應(yīng)用需求。在IT云建設(shè)過(guò)程中,由于業(yè)務(wù)需求增長(zhǎng)快速,IT云資源池?cái)U(kuò)容壓力較大,云資源池中的服務(wù)器數(shù)量快速遞增,上線效率亟需提高。同時(shí),傳統(tǒng)通用服務(wù)器部署模式周期長(zhǎng)、部署密度低的劣勢(shì),給數(shù)據(jù)中心空間、電力、建設(shè)成本和高效維護(hù)管理都帶來(lái)了較大的挑戰(zhàn)。整機(jī)柜服務(wù)器成為IT云建設(shè)的另一可選方案。

在節(jié)能方面,AI等高密度應(yīng)用場(chǎng)景的快速發(fā)展,驅(qū)動(dòng)液冷服務(wù)器成為熱點(diǎn)。隨著AI高密度業(yè)務(wù)應(yīng)用的發(fā)展,未來(lái)數(shù)據(jù)中心服務(wù)器功率將從3kW~5kW向20kW甚至100kW以上規(guī)模發(fā)展,傳統(tǒng)的風(fēng)冷式服務(wù)器制冷系統(tǒng)解決方案已經(jīng)無(wú)法滿足制冷需求,液冷服務(wù)器成為AI應(yīng)用場(chǎng)景下的有效解決方案。

GPU服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)及在電信業(yè)的應(yīng)用

 

GPU服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)

GPU服務(wù)器是單指令、多數(shù)據(jù)處理架構(gòu),通過(guò)與CPU協(xié)同進(jìn)行工作。從CPU和GPU之間的互聯(lián)架構(gòu)進(jìn)行劃分,GPU服務(wù)器又可分為基于傳統(tǒng)PCIe架構(gòu)的GPU服務(wù)器和基于NVLink架構(gòu)的GPU服務(wù)器兩類。GPU服務(wù)器具有通用性強(qiáng)、生態(tài)系統(tǒng)完善的顯著優(yōu)勢(shì),因此牢牢占據(jù)了AI基礎(chǔ)架構(gòu)市場(chǎng)的主導(dǎo)地位,國(guó)內(nèi)外主流廠商均推出不同規(guī)格的GPU服務(wù)器。國(guó)外主流廠商有英偉達(dá)、英特爾、戴爾等,國(guó)內(nèi)主流廠商包括華為、浪潮、新華三、聯(lián)想、曙光等。從GPU服務(wù)器性能來(lái)看,國(guó)內(nèi)外廠商基本處在同一水準(zhǔn)。

GPU服務(wù)器在運(yùn)營(yíng)商IT云建設(shè)中的應(yīng)用

當(dāng)前,電信業(yè)開(kāi)始推動(dòng)GPU服務(wù)器在IT云資源池中的應(yīng)用,省公司現(xiàn)網(wǎng)中已經(jīng)部署了部分GPU服務(wù)器。同時(shí),考慮到GPU成本較高,集團(tuán)公司層面通過(guò)建設(shè)統(tǒng)一AI平臺(tái),集中化部署一批GPU服務(wù)器,形成AI資源優(yōu)化配置。從技術(shù)選型來(lái)看,目前運(yùn)營(yíng)商IT云資源池采用英偉達(dá)、英特爾等廠商相關(guān)產(chǎn)品居多。

GPU服務(wù)器在IT云應(yīng)用中取得了良好的效果。在現(xiàn)網(wǎng)部署的GPU服務(wù)器中,與訓(xùn)練和推理相關(guān)的深度學(xué)習(xí)應(yīng)用占主要部分,占比超過(guò)70%,支撐的業(yè)務(wù)包括網(wǎng)絡(luò)覆蓋智能優(yōu)化、用戶智能定位、智能營(yíng)銷、智能稽核等,這些智能應(yīng)用減少了人工投入成本,提升了工作效率。以智能稽核為例,以往無(wú)紙化業(yè)務(wù)單據(jù)的人工稽核平均耗時(shí)約48秒/單,而AI稽核平均耗時(shí)僅約5秒/單,稽核效率提升達(dá) 90%。同時(shí),無(wú)紙化業(yè)務(wù)單據(jù)人工稽核成本約1.5元/單,采用GPU進(jìn)行AI稽核成本約0.048元/單,稽核成本降低達(dá)96.8%。

整機(jī)柜服務(wù)器發(fā)展態(tài)勢(shì)及在電信業(yè)的應(yīng)用

 

整機(jī)柜服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)

整機(jī)柜服務(wù)器是按照模塊化設(shè)計(jì)思路打造的服務(wù)器解決方案,系統(tǒng)架構(gòu)由機(jī)柜、網(wǎng)絡(luò)、供電、服務(wù)器節(jié)點(diǎn)、集中散熱、集中管理6個(gè)子系統(tǒng)組成,是對(duì)數(shù)據(jù)中心服務(wù)器設(shè)計(jì)技術(shù)的一次根本性變革。整機(jī)柜服務(wù)器將供電單元、散熱單元池化,通過(guò)節(jié)約空間來(lái)提高部署密度,其部署密度通??梢苑丁<泄╇姾蜕岬脑O(shè)計(jì),使整機(jī)柜服務(wù)器僅需配置傳統(tǒng)機(jī)柜式服務(wù)器10%的電源數(shù)量就可滿足供電需要,電源效率可以提升10%以上,且單臺(tái)服務(wù)器的能耗可降低5%。

整機(jī)柜服務(wù)器在運(yùn)營(yíng)商IT云建設(shè)中的應(yīng)用

國(guó)內(nèi)運(yùn)營(yíng)商在IT云建設(shè)中已經(jīng)推進(jìn)了整機(jī)柜服務(wù)器部署,經(jīng)過(guò)實(shí)際應(yīng)用檢驗(yàn),在如下方面優(yōu)勢(shì)明顯。

一是工廠預(yù)制,交付工時(shí)大幅縮短。傳統(tǒng)服務(wù)器交付效率低,采用整機(jī)柜服務(wù)器將原來(lái)在數(shù)據(jù)中心現(xiàn)場(chǎng)進(jìn)行的服務(wù)器拆包、上架、布線等工作轉(zhuǎn)移到工廠完成,部署的顆粒度從1臺(tái)上升到幾十臺(tái),交付效率大大提升。以一次性交付1500臺(tái)服務(wù)器為例,交付工作量可減少170~210人天,按每天配10人計(jì)算,現(xiàn)場(chǎng)交付時(shí)間可節(jié)省約17~21天。

二是資源池化帶來(lái)部件數(shù)量降低,故障率大幅下降。整機(jī)柜服務(wù)器通過(guò)將供電、制冷等部件資源池化,大幅減少了部件數(shù)量,帶來(lái)故障率的大幅降低。圖1比較了32節(jié)點(diǎn)整機(jī)柜服務(wù)器與傳統(tǒng)1U、2U服務(wù)器機(jī)型各自的電源部件數(shù)量及在一年內(nèi)的月度故障率情況。由于32節(jié)點(diǎn)整機(jī)柜服務(wù)器含10個(gè)電源部件,而32臺(tái)1U通用服務(wù)器的電源部件為64個(gè),相較而言,整機(jī)柜電源部件數(shù)減少84.4%。由于電源部件數(shù)量的降低,32節(jié)點(diǎn)整機(jī)柜服務(wù)器相對(duì)于32臺(tái)1U通用服務(wù)器的月度故障率也大幅縮減。

數(shù)據(jù)中心服務(wù)器技術(shù)發(fā)展趨勢(shì)與應(yīng)用

圖1 整機(jī)柜服務(wù)器與傳統(tǒng)機(jī)型服務(wù)器月度故障率對(duì)比

三是運(yùn)維效率提升60%以上。整機(jī)柜服務(wù)器在工廠預(yù)制機(jī)柜布線,網(wǎng)絡(luò)線纜在工廠經(jīng)過(guò)預(yù)處理,線纜長(zhǎng)度精確匹配,理線簡(jiǎn)潔,接線方式統(tǒng)一規(guī)范,配合運(yùn)維標(biāo)簽,在運(yùn)維中可以更方便簡(jiǎn)潔地對(duì)節(jié)點(diǎn)實(shí)施維護(hù)操作,有效降低運(yùn)維誤操作,提升運(yùn)維效率60%以上,并大幅減少發(fā)生故障后的故障恢復(fù)時(shí)間。

液冷服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)及在電信業(yè)的應(yīng)用

 

液冷服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)

液冷服務(wù)器技術(shù)也稱為服務(wù)器芯片液體冷卻技術(shù),采用特種或經(jīng)特殊處理的液體,直接或近距離間接換熱冷卻芯片或者IT整體設(shè)備,具體包括冷板式冷卻、浸沒(méi)式冷卻和噴淋式冷卻3種形態(tài)。液冷服務(wù)器可以針對(duì)CPU熱島精確定點(diǎn)冷卻,精確控制制冷分配,能真正將高密度部署帶到前所未有的更高層級(jí)(例如20kW~100kW高密度數(shù)據(jù)中心),是數(shù)據(jù)中心節(jié)能技術(shù)的發(fā)展方向之一,3種液冷技術(shù)對(duì)比如表1所示。

表1 3種液冷技術(shù)對(duì)比

數(shù)據(jù)中心服務(wù)器技術(shù)發(fā)展趨勢(shì)與應(yīng)用

液冷服務(wù)器在運(yùn)營(yíng)商IT建設(shè)中的應(yīng)用

液冷服務(wù)器技術(shù)目前在我國(guó)仍處于應(yīng)用初期,產(chǎn)業(yè)鏈尚不完備、設(shè)備采購(gòu)成本偏高、采購(gòu)渠道少、電子元器件的兼容性低、液冷服務(wù)器專用冷卻液成本高等問(wèn)題是液冷服務(wù)器尚未大規(guī)模推廣的重要原因。從液冷服務(wù)器在運(yùn)營(yíng)商數(shù)據(jù)中心領(lǐng)域的具體應(yīng)用案例來(lái)看,運(yùn)營(yíng)商在IT云資源池規(guī)劃和建設(shè)過(guò)程中,通常會(huì)對(duì)液冷服務(wù)器的發(fā)展現(xiàn)狀、技術(shù)成熟度等進(jìn)行分析論證。

考慮到目前液冷服務(wù)器規(guī)?;瘧?yīng)用尚處于起步階段,需要3~5年的引入期,因此暫時(shí)未在IT云資源池建設(shè)中進(jìn)行大規(guī)模落地部署,但在部分地區(qū)有小規(guī)模應(yīng)用,如中國(guó)移動(dòng)南方基地?cái)?shù)據(jù)中心已經(jīng)開(kāi)展液冷服務(wù)器試點(diǎn)應(yīng)用,中國(guó)聯(lián)通研究院也在開(kāi)展邊緣數(shù)據(jù)中心服務(wù)器噴淋式液冷系統(tǒng)的開(kāi)發(fā)。未來(lái),隨著IT云建設(shè)規(guī)模、建設(shè)密度的繼續(xù)攀升,以及液冷產(chǎn)業(yè)生態(tài)體系的逐步成熟,液冷服務(wù)器在IT云建設(shè)中將有更大的應(yīng)用空間。

總體來(lái)看,運(yùn)營(yíng)商IT云資源池建設(shè)對(duì)服務(wù)器計(jì)算性能、延遲、吞吐、制冷、定制化、分布式部署等方面都提出了更高要求。未來(lái),GPU服務(wù)器、定制化整機(jī)柜服務(wù)器、液冷服務(wù)器等新興服務(wù)器技術(shù)將快速迭代,為運(yùn)營(yíng)商數(shù)據(jù)中心服務(wù)器技術(shù)的發(fā)展和演進(jìn)帶來(lái)新的思路和路徑。

本文標(biāo)題:數(shù)據(jù)中心服務(wù)器技術(shù)發(fā)展趨勢(shì)與應(yīng)用
標(biāo)題鏈接:http://www.muchs.cn/news29/200779.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、關(guān)鍵詞優(yōu)化網(wǎng)站策劃、做網(wǎng)站App開(kāi)發(fā)、App設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都app開(kāi)發(fā)公司