云數(shù)據(jù)中心4類機(jī)架/機(jī)柜設(shè)計(jì)的特征與進(jìn)展

2022-10-11    分類: 網(wǎng)站建設(shè)

2019年6月25日,由浪潮與OCP開放計(jì)算社區(qū)聯(lián)合主辦的首屆OCP China Day(開放計(jì)算中國日)在北京正式開啟。本屆OCP China Day聚焦人工智能、邊緣計(jì)算、OpenRack、OpenRMC、SONiC、OAM等前沿技術(shù)話題,來自Facebook、LinkedIn、Intel、微軟、百度、騰訊、阿里、諾基亞、中國移動(dòng)、浪潮等資深技術(shù)專家分享了最新技術(shù)進(jìn)展。近千名工程師和數(shù)據(jù)中心從業(yè)者參加了此次大會(huì)。

OCP是全球大的開放硬件社區(qū),2011年由Facebook發(fā)起成立,其宗旨是以開源開放的方式,重構(gòu)當(dāng)前的數(shù)據(jù)中心硬件,發(fā)展面向下一代數(shù)據(jù)中心的服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、基礎(chǔ)設(shè)施等創(chuàng)新硬件。目前,OCP核心會(huì)員超過200家。

伴隨著云計(jì)算產(chǎn)業(yè)的發(fā)展,云數(shù)據(jù)中心創(chuàng)新方向逐漸明晰。在數(shù)據(jù)中心創(chuàng)新的整體策略上,幾乎全球所有的CSP都選擇了高集成、模塊化、面向應(yīng)用的設(shè)備定制化。開放計(jì)算也對數(shù)據(jù)中心的設(shè)計(jì)產(chǎn)生了重大影響,云數(shù)據(jù)中心需要更加通用的機(jī)架和機(jī)柜設(shè)計(jì)。在本次OCP China Day上,來自O(shè)CP基金會(huì)、LinkedIn、百度、Facebook的專家分別介紹了在Olympus、Open19、ODCC天蝎項(xiàng)目、Open Rack 4種機(jī)架/機(jī)柜設(shè)計(jì)不同特征和最新進(jìn)展。

以下為大會(huì)演講實(shí)錄:

OCP CTO Bill Carter:云計(jì)算的發(fā)展推進(jìn)了機(jī)柜進(jìn)行擴(kuò)展性和效率的優(yōu)化

云數(shù)據(jù)中心4類機(jī)架/機(jī)柜設(shè)計(jì)的特征與進(jìn)展

OCP CTO Bill Carter

主持人:歡迎大家重新回到主會(huì)場,我們下午精彩繼續(xù)。下午四個(gè)項(xiàng)目的分享都是OCP重點(diǎn)投入的,第一個(gè)主題分享,我們再次有請OCP CTO Bill Carter上臺(tái)。

OCP CTO Bill Carter:非常感謝,下面我們會(huì)談一下機(jī)柜的架構(gòu),接下來這一個(gè)小時(shí)我有一系列的嘉賓發(fā)言人要上臺(tái)講不同的機(jī)架和機(jī)柜的架構(gòu),但是在此之前我想要講講我們怎么樣走到今天這里,我們這個(gè)旅程是什么樣的進(jìn)展。我們先看一下一百年前的情況吧,大家能認(rèn)得出來機(jī)電器嗎?這其實(shí)是一個(gè)用在早期的發(fā)電報(bào)的時(shí)代,通過有線去發(fā)布信號(hào),在美國是ATNT發(fā)明的,他們相當(dāng)于中國常見的電信商。他們把這些東西放在機(jī)柜里面,這是當(dāng)時(shí)的機(jī)電器的機(jī)架在1922年的模樣。因?yàn)樗麄冇羞@么多機(jī)柜,所以為它專門書寫了技術(shù)規(guī)范復(fù)制在美國各地,因此1934年這就變成了第一個(gè)EIA 19英寸的機(jī)柜的規(guī)范。如果說大家今天還用的是EIA的19英寸的機(jī)架的話,那你用的是將近一百年前的技術(shù)了,因此也會(huì)有一個(gè)項(xiàng)目是改進(jìn)機(jī)架設(shè)計(jì)的。

這是到2011年、2012年我們會(huì)涉及到一些機(jī)架的設(shè)計(jì),今天也會(huì)分享到一些相關(guān)的信息,希望我們可以進(jìn)一步發(fā)展,到現(xiàn)在更加通用的機(jī)架和機(jī)柜的設(shè)計(jì)。也是因?yàn)樵朴?jì)算的發(fā)展推進(jìn)了機(jī)柜為擴(kuò)展性和效率進(jìn)行優(yōu)化,我們有4種非常不同的機(jī)柜的設(shè)計(jì),一個(gè)是Olympus項(xiàng)目,是幾年前微軟牽頭建立的項(xiàng)目,跟OCP一起合作;當(dāng)然還有Open19的設(shè)計(jì),也是LinkedIn的工程團(tuán)隊(duì)負(fù)責(zé)統(tǒng)領(lǐng)的,Zaid之后會(huì)講LinkedIn的設(shè)計(jì)。還有ODCC天蝎項(xiàng)目,大家最熟悉這方面,百度的丁瑞全先生會(huì)跟我們分享這方面。最后我們會(huì)邀請來自Facebook的Steve Mills跟我們講一下Open Rack以及Facebook對此的貢獻(xiàn),他們已經(jīng)走過了三代,現(xiàn)在正在為第三代努力。我們希望把這些項(xiàng)目的東西都集成在一起給大家分享得更多。今天早晨我講到八年前我們關(guān)注不同的地方,現(xiàn)在關(guān)注到各個(gè)項(xiàng)目的相似之處。

Olympus的微軟的同事來不了,我?guī)退v幾頁片子。我們分享一下這個(gè)項(xiàng)目的情況,它是一個(gè)整機(jī)柜的設(shè)計(jì),有幾個(gè)部分,在設(shè)計(jì)中分享和貢獻(xiàn)給了社區(qū),19英寸的機(jī)架,用的是和ATNT二十世紀(jì)同樣的設(shè)計(jì),但是有一個(gè)修改,就是他們有一個(gè)機(jī)架管理的解決方案在上面,所以把前端放入計(jì)算節(jié)點(diǎn)之后它在背后就自動(dòng)連接起來。另外還有通用的電源線,所以不管你的數(shù)據(jù)中心是什么樣的都可以通到數(shù)據(jù)中心的電源,這電源的連接器有的地方有有不同的大小,會(huì)發(fā)明一個(gè)系統(tǒng)使得這個(gè)電源線能夠互操作。同時(shí)也設(shè)計(jì)了機(jī)柜背后有配電系統(tǒng),把這個(gè)電源線相應(yīng)的信號(hào)轉(zhuǎn)換之后,所有的交流電傳給計(jì)算節(jié)點(diǎn),他們有1U2U3U的服務(wù)器的機(jī)箱,也是參考設(shè)計(jì)的一部分,可以互換使用。還有一個(gè)新的供電的解決方案,它是非常獨(dú)特的,它沒有兩個(gè)供電,只有一個(gè)供電電源,但是有兩個(gè)整流器。

我們來看這幾個(gè)特征。背部有19英寸EIA的兼容,是1200毫米深的機(jī)柜,它們的電源功率解決方案在背板,也有機(jī)架的管理,能夠提供彈性。還有我剛才說的電源,它有兩個(gè)整流器,但是每一個(gè)相位都有一個(gè)整流器,所以它還有相位的平衡。今天很多時(shí)候我們會(huì)把每個(gè)相位都進(jìn)行轉(zhuǎn)換,輸出直流電或交流電,它們有可能會(huì)不平衡,但是有了這種相位的平衡器均衡器,三個(gè)相位就可以有同樣的電流,都放到同一個(gè)供電的盒子里面,這就是Olympus項(xiàng)目的特點(diǎn),所有的計(jì)算節(jié)點(diǎn)都是熱插拔,可以盲插,適應(yīng)背后配電的系統(tǒng)。他們獲得了世界各地的安全認(rèn)證,對所有的組件都獲得了安全認(rèn)證,這是非常必要的。因?yàn)榘堰@個(gè)東西安裝在自己世界各地的數(shù)據(jù)中心,有的時(shí)候放到了客戶的數(shù)據(jù)中心里面,我們把它稱為其他人共有的數(shù)據(jù)中心。這個(gè)有可能會(huì)對安全方面,像電磁干擾有一些安全方面的要求,所以希望全世界各地安全方面的要求都能夠滿足,無論地點(diǎn)在哪里都可以兼容,無論是微軟的數(shù)據(jù)中心還是客戶的數(shù)據(jù)中心。除了簡單易用和擴(kuò)展性以外,它們還有其他的特點(diǎn)。

左下方是2路的計(jì)算節(jié)點(diǎn),它是一個(gè)非常好的開放的設(shè)計(jì),可以看到只有一個(gè)銀盒子在最后角落里,這是供電的單元,這種彈性和相位的均衡也是在供電的小盒子里設(shè)計(jì)好的,這就是Olympus項(xiàng)目。

LinkedIn Head of Infrastructure Engineering Zaid Ali Kahn:很多邊緣的機(jī)架都不是集中數(shù)據(jù)中心的工程師去維護(hù),邊緣的數(shù)據(jù)中心需要能夠?qū)崿F(xiàn)自維護(hù)或者簡單省事的維護(hù)

云數(shù)據(jù)中心4類機(jī)架/機(jī)柜設(shè)計(jì)的特征與進(jìn)展

Zaid Ali Kahn, LinkedIn Head of Infrastructure Engineering

OCP CTO Bill Carter:接下來我們再次邀請Zaid Ali Kahn上場,他是LinkedIn的基礎(chǔ)設(shè)施工程的首席工程師,讓他介紹一下LinkedIn在Open 19架構(gòu)方面的情況。

Zaid Ali Kahn:介紹了EIA19英寸以及它有多長時(shí)間的歷史了,我在想今天在講什么以及架構(gòu)未來如何發(fā)展,我們未來的子孫后代會(huì)怎么看我們現(xiàn)在的情況,他們會(huì)不會(huì)也召開一個(gè)研討會(huì),四五十年以后人們來講我們的技術(shù)也是很老的技術(shù)了。無論如何這都是很好的工程。

我跟大家介紹一下Open 19的技術(shù),我們最近剛剛把Open 19的技術(shù)貢獻(xiàn)給了OCP,我們有孵化的委員會(huì),如果你是在這個(gè)領(lǐng)域工作的話,那么7月份的時(shí)候我們會(huì)對架構(gòu)方面有更深度的討論,所以歡迎大家參加,希望這個(gè)技術(shù)能有更加廣泛的應(yīng)用,而不只是在我們數(shù)據(jù)中心的應(yīng)用。我跟大家介紹一下我們的技術(shù)架構(gòu)。先看幾個(gè)想法,我們?yōu)槭裁匆@么做?幾年前我們在數(shù)據(jù)中心有一些限制,我們的空間有很大的限制,而且電源功率也有很大的限制,我們沒有奢侈的買很多地,豎很多的機(jī)柜起來,每個(gè)機(jī)柜都很大,事實(shí)上我們有空間的限制,我們需要空間和功率得到大的利用,所以我們需要機(jī)柜能夠比較緊湊。我們現(xiàn)在一個(gè)機(jī)柜要裝96個(gè)服務(wù)器節(jié)點(diǎn),這樣的復(fù)雜性就要求我們需要有些新的解決方案,尤其是如果你要實(shí)現(xiàn)這樣的規(guī)模效應(yīng),需要大幅度的提高效率、降低成本。我們就發(fā)明了這種Open 19的技術(shù),它是基于計(jì)算節(jié)點(diǎn)的小盒子,模塊化的能適應(yīng)所有19英寸的機(jī)架,就是用很多配置,可以是雙寬的或雙高的,我們希望把每一個(gè)計(jì)算節(jié)點(diǎn)的電源功率的部分都集中起來,所以我們有一個(gè)電源架。

另外一個(gè)部分就是我們的交換機(jī)交換層,大家在這個(gè)圖上可以看到有兩個(gè)交換機(jī),其實(shí)兩個(gè)不是必要的,我們這樣設(shè)計(jì)是因?yàn)橐粋€(gè)機(jī)柜有2個(gè)葉節(jié)點(diǎn),這是里邊的一些構(gòu)造。接下來我再深度分析一下,機(jī)柜的這些盒子有12 2U或8 2U的選擇,你的配置可以選,你可以放4個(gè)節(jié)點(diǎn),你可以放2個(gè)雙高半寬的節(jié)點(diǎn),可以放2個(gè)雙寬的放1個(gè)雙高的節(jié)點(diǎn),都可以。我們的想法就是一系列不同的計(jì)算節(jié)點(diǎn)的大小尺寸和風(fēng)量都不同,都可以放到機(jī)架當(dāng)中去,可以在右邊看到背部是卡扣式的后開門,就像剛才Bill Carter在Olympus項(xiàng)目中說到的,不希望這個(gè)數(shù)據(jù)中心的工程師需要走到機(jī)柜的后面做一些維修,所以從前邊基本都可以做得到,能夠盡量的簡單。

接下來我們說一下這些磚塊的外形,它們都是計(jì)算節(jié)點(diǎn),我們不希望所有的節(jié)點(diǎn)都是我們自己設(shè)計(jì),我們希望把它開源出去,讓大家都可以貢獻(xiàn),無論是服務(wù)器內(nèi)部還是其他的部分,使得多個(gè)供應(yīng)商都可以自己去制造生產(chǎn)。你可以有單磚塊的可以有雙高半寬、雙高雙寬的節(jié)點(diǎn),我們有線性的功率和數(shù)據(jù)增長,它也是自我保持的,電磁干擾、安全和冷卻都能夠做得很好。這是我特別喜歡的一點(diǎn),我們很大的一個(gè)創(chuàng)新之處就是電纜系統(tǒng),因?yàn)橐话愕姆?wù)器電纜布線特別復(fù)雜,所以我們非常強(qiáng)調(diào)這點(diǎn),大家可以看到背部所有電纜,藍(lán)色是電源,白色是網(wǎng)絡(luò),背部的卡扣,它有25G和100G的網(wǎng)絡(luò)配置。

我們的想法就是它能夠非常簡單地管理,像我之前說的我們不希望數(shù)據(jù)中心的工程師花很多時(shí)間去布線,我們希望能夠簡化他們的工作,讓他們更快的能布好,這樣的話在機(jī)柜的集成方面有6倍的改進(jìn)。

我們再看一下電源架。這是下一個(gè)階段,我們把這個(gè)服務(wù)器里邊的這些電源部分全部都拿出來集中在一起放到一個(gè)電源架上面,它可以是19.2千瓦,6個(gè)3.2千瓦,它通過端口管理,所有的都可配置,我們希望所有的服務(wù)器都能夠?qū)崿F(xiàn)統(tǒng)一的管理,可以通過電源架把它開啟和關(guān)閉,而且它是充分冗余的,有AB輸入,在這點(diǎn)上我們跟很多的供應(yīng)商合作。

下面我們分享一下這項(xiàng)技術(shù)的好處。其中一點(diǎn)沒有在這個(gè)片子上,很多人都在討論邊緣,邊緣我們需要什么?它可能需要不同類型的支持,很多邊緣的機(jī)架都不是集中的數(shù)據(jù)中心的工程師去維護(hù),所以邊緣的數(shù)據(jù)中心需要能夠?qū)崿F(xiàn)自維護(hù)或者簡單省事的得到維護(hù),所以O(shè)pen 19更適合部署到邊緣,因?yàn)椴季€很簡單,其他的解決方案都是非常易于維護(hù)的。所以說我們覺得很多人會(huì)感興趣,將Open 19技術(shù)采用在邊緣數(shù)據(jù)中心當(dāng)中。所以我們的想法就是它能夠適合所有的19英寸的機(jī)架,我們還可以做一些經(jīng)濟(jì)化,我們有一些架構(gòu)的改良使得實(shí)現(xiàn)更好的一體化。我們可以實(shí)現(xiàn)5-6倍的更快的機(jī)柜級(jí)的融合集成。我們還有一個(gè)小視頻,就是一般的機(jī)柜的集成和Open 19機(jī)柜的機(jī)柜,大家可以對比它有多快。在服務(wù)器的方面,我們提高了效率,沒有服務(wù)器的電源供電,這樣的話效率能夠提高,另外有很大的節(jié)約。隨著我們數(shù)據(jù)中心的擴(kuò)展,有了成千上萬的節(jié)點(diǎn),加總起來的節(jié)約就會(huì)非常明顯。

這是在我們生產(chǎn)環(huán)境當(dāng)中的情況,左邊是那些空的盒子,右邊放了計(jì)算節(jié)點(diǎn),大家可以看出來把它們放進(jìn)去非常容易,看起來就像一般的19英寸的機(jī)柜一樣,但是它是卡扣式的。我們在尋找高內(nèi)存的高端的服務(wù)器,我們需要每個(gè)服務(wù)器消費(fèi)3T的內(nèi)存,我們在想怎么樣為這個(gè)項(xiàng)目尋到合適的架構(gòu),因?yàn)槲覀円彩荗CP的一部分,所以我們也把這個(gè)問題提給了社區(qū)。有人說Olympus的模板是最好的方案,所以我們把它放到了Open 19平臺(tái)上面,我們現(xiàn)在的數(shù)據(jù)中心也有Olympus的模板,就是照片里的這個(gè)樣子,我們也可以把其他項(xiàng)目的優(yōu)勢集成到我們自己的Open 19的項(xiàng)目中,然后集成起來,有了Open 19和Olympus加起來就能實(shí)現(xiàn)更好的效果。我們在相互轉(zhuǎn)換進(jìn)行一些匯總,這就是我非常自豪的想跟大家分享。

未來我們也會(huì)開放找更多其他的因素,我們也有些新的服務(wù)器的模塊,其中LinkedIn也會(huì)貢獻(xiàn)自己的架構(gòu),這是我們路線圖當(dāng)中的一些設(shè)想。我們和其他不同的IC合作,我們想要考慮邊緣數(shù)據(jù)中心。這是我們布線的系統(tǒng)在后部,大家可以看到背后是怎么相連的,非常的整潔。

謝謝大家,我的分享到此結(jié)束,我希望剛才給大家分享的這些信息大家都會(huì)覺得比較有用,如果大家有任何問題的話可以隨時(shí)找我溝通。

百度AI系統(tǒng)架構(gòu)師丁瑞全:天蝎項(xiàng)目在中國已進(jìn)行了大規(guī)模部署,在新的AI、5G以及液冷和48V供電場景里也做了新的嘗試,希望和OCP共同推動(dòng)技術(shù)標(biāo)準(zhǔn),應(yīng)對新的挑戰(zhàn)

云數(shù)據(jù)中心4類機(jī)架/機(jī)柜設(shè)計(jì)的特征與進(jìn)展

百度AI系統(tǒng)架構(gòu)師 丁瑞全

百度AI系統(tǒng)架構(gòu)師丁瑞全:我是丁瑞全,百度AI的系統(tǒng)架構(gòu)師,這是在百度陽泉數(shù)據(jù)中心部署的照片,我之前沒有去過這個(gè)數(shù)據(jù)中心,發(fā)現(xiàn)這個(gè)Rack這么漂亮,百度在今年年初和浪潮一起創(chuàng)造了一個(gè)記錄,在8個(gè)小時(shí)成功交付了一萬臺(tái)服務(wù)器,這是非常驚人的,這就是整機(jī)柜給我們帶來的好處。

天蝎整機(jī)柜的歷史,上面是主要的幾個(gè)階段,我們發(fā)布的一些時(shí)間點(diǎn),下面是基于天蝎整機(jī)柜經(jīng)典的產(chǎn)品。天蝎項(xiàng)目在2011年就成立了,當(dāng)時(shí)百度聯(lián)合阿里、騰訊以及相關(guān)主要廠商成立了這個(gè)組織,這個(gè)時(shí)間點(diǎn)和OCP時(shí)間差不多,上午的家軍和Bill講到我們嘗試和OCP組織建立合作交流,共同推動(dòng)標(biāo)準(zhǔn)。也是因?yàn)閲鴥?nèi)、國外特殊場景的差異沒有達(dá)到融合,在之后的幾年里各自按照自己的路線發(fā)展。

2014年發(fā)布了天蝎2.0,在Scorpio2.0可以達(dá)到大規(guī)模交付的狀態(tài)了,基于這個(gè)標(biāo)準(zhǔn)開發(fā)了冷存儲(chǔ)服務(wù)器,單U 18個(gè)盤,還有高溫耐腐蝕的服務(wù)器,針對中國的環(huán)境做的相關(guān)設(shè)計(jì),我們也發(fā)布了X-Man,百度AI計(jì)算機(jī),也是當(dāng)時(shí)業(yè)界最的產(chǎn)品。之后發(fā)布了天蝎2.5,在這之上也做了產(chǎn)品迭代,X-Man2.0發(fā)布了,然后在2018年底發(fā)布了X-Man3.0,實(shí)現(xiàn)16個(gè)AI加速器高速互聯(lián),我們現(xiàn)在已經(jīng)進(jìn)入了X-Man3.0的階段。

在AI、5G、邊緣計(jì)算以及云計(jì)算技術(shù)浪潮下,我們面臨新的挑戰(zhàn)和機(jī)遇,我們需要更大的性能,面臨更大規(guī)模供電挑戰(zhàn),我們需要支持單節(jié)點(diǎn)或者跨節(jié)點(diǎn)互聯(lián),我們有很多新的AI節(jié)點(diǎn)出來,需要標(biāo)準(zhǔn)化通用化,稍后我也會(huì)分享在這個(gè)方面做的工作。5G和邊緣計(jì)算有從云端到算力的部署,有AI的能力,能更好地做邊緣的語音圖像相關(guān)的識(shí)別,更好地降低成本,云計(jì)算這一塊需要有快速交付部署能力,同時(shí)以客戶需求為先,快速達(dá)到交互的方案。

1.0是模塊化,將供電散熱集中管理分離出來,有比較好的模塊基礎(chǔ)。2.0主要做的標(biāo)準(zhǔn)化,1.0產(chǎn)品里不同系統(tǒng)廠商方案在一個(gè)Rack里無法共存,這給升級(jí)迭代帶來很多問題,所以2.0做了很多標(biāo)準(zhǔn)化,把硬件軟件做得很清楚,不管是中間件、還是散熱還是服務(wù)器,都可以在Rack里共享。

在3.0,面對5G、邊緣計(jì)算、AI新的場景里以及云計(jì)算的趨勢做了一定的改進(jìn),我們肯定更關(guān)注彈性、可擴(kuò)展性,減少相關(guān)部件,支持更大的供電能力,這是更高功耗相關(guān)的CPU和AI芯片,我們也需要更好的靈活部署方式。

這是3.0 Rack大的架構(gòu),我們以SU為單元構(gòu)建這個(gè)系統(tǒng),SU和OCP的OU有一點(diǎn)小的差別,稍微矮一點(diǎn),這個(gè)我們的需求都能夠滿足,同時(shí)在Rack層面部署更多的節(jié)點(diǎn),所以有比較多的好處,3.0同時(shí)可以兼容19英寸和21英寸的產(chǎn)品,達(dá)到降低整個(gè)系統(tǒng)的成本。

供電方面相比以前有很大的變化,我們設(shè)計(jì)了48V的PSU,也有AI的場景,包括在多個(gè)CPU里單個(gè)節(jié)點(diǎn),怎么去支持整個(gè)部署能力,降低成本,48V是AI關(guān)鍵的基礎(chǔ)。

散熱方面,我們之前是整機(jī)柜集中式的散熱,它的好處是比較靈活,而云計(jì)算面臨變遷和混合部署也帶來了新的問題,所以我們在新的層面上解決問題,同時(shí)采用液冷散熱技術(shù)。我們在2017年就部署了液冷技術(shù),再逐步推廣到通用的CPU計(jì)算場景里。

這是我們幾個(gè)典型的計(jì)算機(jī)配置,左邊是微服務(wù)器低功耗產(chǎn)品,右邊是高密度低成本的產(chǎn)品。第三,全寬主板,主要面向計(jì)算密集型產(chǎn)品,以及高性能存儲(chǔ)場景。

最后面是第三個(gè)1U主板,在系統(tǒng)層面通過2U構(gòu)建模塊,支持大容量高計(jì)算場景的需求。所以剛才講的是整個(gè)天蝎項(xiàng)目,也發(fā)展了很久,在中國也部署了幾萬個(gè)Rack,達(dá)到近百萬服務(wù)器的規(guī)模,在新的AI、5G場景里,在液冷和48V供電場景里也做了新的嘗試,我們也希望在這方面和OCP共同推動(dòng)技術(shù)標(biāo)準(zhǔn),應(yīng)對新的挑戰(zhàn)。

Steve Mills, Facebook Technical Lead: Facebook看到了在共同平臺(tái)上構(gòu)建基礎(chǔ)架構(gòu)的價(jià)值,我們可以在這個(gè)平臺(tái)上分享新技術(shù)的開發(fā)

云數(shù)據(jù)中心4類機(jī)架/機(jī)柜設(shè)計(jì)的特征與進(jìn)展

Steve Mills, Facebook Technical Lead

Bill Carter:謝謝Richard,過去八年里我們確實(shí)是從當(dāng)時(shí)的標(biāo)準(zhǔn)慢慢向現(xiàn)在演化,當(dāng)時(shí)我們是12V的標(biāo)準(zhǔn),現(xiàn)在八年過去了我們變成了48V的標(biāo)準(zhǔn),所以再次感謝丁先生跟我們分享天蝎這個(gè)項(xiàng)目。下面我們要有請來自Facebook的Steve Mills跟大家分享,Steve Mills在這個(gè)項(xiàng)目里已經(jīng)工作了四五年的時(shí)間,在我們這個(gè)行業(yè)已經(jīng)是很長時(shí)間了,它主要是在OCP的RACK,還有供電的項(xiàng)目有很多經(jīng)驗(yàn)。

Steve Mills, Facebook Technical Lead:大家好,大家知道Open RackV3是下一代的解決方案,從今年的早些時(shí)間開始的,今天我要跟大家分享我們Open Power這個(gè)項(xiàng)目怎么通過OCP社區(qū)進(jìn)行協(xié)作。我希望跟大家介紹一下什么是Open Rack V3,我們怎么在OCP的社區(qū)進(jìn)行合作,接下來這個(gè)項(xiàng)目會(huì)有什么進(jìn)展,首先談一下為什么是Open Rack V3。

過去一段時(shí)間我們很迅速的擴(kuò)展了我們擁有的很多技術(shù)的能力,因?yàn)榧夹g(shù)發(fā)展非常快,這個(gè)會(huì)議室里幾乎每個(gè)人都遇到了物理學(xué)基本限制相關(guān)的障礙,這些是原子級(jí)別的問題,是大家都還沒有特別熟悉的領(lǐng)域,探索的成本越來越高。很多組件的制造商可以進(jìn)行改進(jìn),但是需要很多研發(fā)支出才能實(shí)現(xiàn)這些收益。與這些相應(yīng)的研發(fā)支出和相應(yīng)的后續(xù)步驟怎么更好的控制成本和風(fēng)險(xiǎn)呢,最好的辦法就是我們進(jìn)行分享,這就是像OCP這樣的平臺(tái)的用武之地,F(xiàn)acebook看到了在共同平臺(tái)上構(gòu)建基礎(chǔ)架構(gòu)的價(jià)值,我們可以在這個(gè)平臺(tái)上分享新技術(shù)的開發(fā),F(xiàn)acebook V1和V2平臺(tái)一開始是Facebook內(nèi)部開發(fā)的,后來在后期的研發(fā)階段進(jìn)行開放研發(fā)。在這個(gè)架構(gòu)里面,因?yàn)閂1和 V2是內(nèi)部研發(fā)的,所以非常專注于Facebook自己的需求,后來我們有Open Rack V3之后它就有更開放的社區(qū),所以越來越多的人就可以用這個(gè)平臺(tái)給自己打造適合自己的功能,我們可以在一個(gè)通用的框架下增加更多的功能,所以我們需要的這樣的平臺(tái)需要有一定的靈活度,這樣我們的用戶才能把這些功能做定制化的開發(fā)。

我們在V3里面的power架構(gòu)能夠有更多的靈活定制,不是僅關(guān)注Facebook的需求。我們在一些比較先進(jìn)的冷卻高效機(jī)制里也有相關(guān)技術(shù)的發(fā)展,希望通過Open Rack V3為更多Open Rack架構(gòu)做出貢獻(xiàn)。這就是我對Open Rack V3的介紹,Open Rack V3現(xiàn)在又有什么新進(jìn)展呢?首先就是我剛才說的Open Rack V3不僅僅是針對Facebook的需求,而是能夠?yàn)楦_放的社區(qū)提供更好的功能,我們在垂直間隔里跟V2有一些變化,V2是open U 14、18毫米的間隔,V3是44.45毫米的間隔,微軟、百度也有相應(yīng)的需求,我們現(xiàn)在沒有支持到EIA的寬度,只是垂直間隔這塊。

第二是我們的動(dòng)態(tài)定制,從V2 1400kg到V3的1600kg,第三是高度從41個(gè)openU到44×48mmopenU 或48×44.45,另外是Cabal(音)Manager,我們把它當(dāng)做一個(gè)可選的工具包,通過這個(gè)可選的工具包大家可以更好的給自己做定制的開發(fā)。下面就是液體的起管,這個(gè)液體管匯Liquid Manifold (ACS)就是我剛才說的先進(jìn)的冷卻機(jī)制,它也放在我們的可選工具包里的功能。另外是后端數(shù)據(jù)結(jié)構(gòu),也是放在這個(gè)可選工具包里面,它也是熱插拔的。它有幾種可以選的方案,比如高速的銅線、高速的光纖或者低速的銅線管理主線,這個(gè)也有一些方向可以走。我們在側(cè)邊板這塊,F(xiàn)acebook V2這塊只能有空氣的containment,現(xiàn)在到V3會(huì)有更多的安全的設(shè)置放到里面,可以選擇更多安全和其他的設(shè)置。對于我們的安全而言我們增加了更多的規(guī)格,整個(gè)項(xiàng)目正在進(jìn)展過程中。下面看一下總線的電壓的值,現(xiàn)在不僅有12V,也有48V,這兩個(gè)都是可選的。電源架既可以是之前固定的,現(xiàn)在在總線任何的地方都可以進(jìn)行部署,它可以在不同的電源架上進(jìn)行安置。

關(guān)于現(xiàn)在的電源架的位置,機(jī)架里面可以有一個(gè)固定的安置主要原因是它有一個(gè)螺栓,這個(gè)螺栓可以將其電源架的輸入和電源架進(jìn)行一個(gè)固定,對于V3而言它并不是螺栓進(jìn)行連接,一旦改變了連接的方式之后,你在任何機(jī)架的位置都可以進(jìn)行安裝,這樣你在進(jìn)行部署的時(shí)候能夠讓客戶有非常多的靈活性。當(dāng)然我們還有電源架和BBU,可以讓它有非常多的靈活性,它可以和BBU進(jìn)行靈活的部署,比如我們BBU的容量在需要的時(shí)候可以進(jìn)行不同的部署。我們也有調(diào)峰的功能,我們有關(guān)于電源架輸入的部署,所以無論是在前端還是后端我們都可以對電源架進(jìn)行相關(guān)的部署。傳統(tǒng)而言,F(xiàn)acebook用的是5PIN的輸入,到現(xiàn)在我們已經(jīng)有了7PIN的輸入,這樣我求可以將PDU從機(jī)架上釋放下來。我們可以看到這個(gè)功能大家已經(jīng)演示過了,就是在微軟的Olympus當(dāng)中,也是在自己的開放機(jī)架的部署中做好的。

下面看只有一個(gè)唯一的功率區(qū),之前有2個(gè),F(xiàn)acebook在大多數(shù)情況下都會(huì)部署一個(gè)功率區(qū)。如何和更廣泛的OCP的社區(qū)進(jìn)行聯(lián)合,對于Facebook的文化而言聯(lián)合一直是我們的一部分,這就是我們認(rèn)為我們和工業(yè)界的合作伙伴合作是我們工作方式的延伸,能夠和業(yè)界的合作伙伴做得更好,而且在過去一些年我們一直能為社區(qū)做出自己的貢獻(xiàn),這也是在Open RackV3中我們一直遵循的Facebook的準(zhǔn)則。

我們看一下這個(gè)架構(gòu)究竟是怎樣的。它是48V的走線和48V的IT后邊的電力連接,這兩個(gè)組件就可以和總件進(jìn)行相關(guān)的連接,它已經(jīng)是在Open Rack的部署中做好,我們特別希望你們能夠用它現(xiàn)在部署好的方式進(jìn)行使用。當(dāng)然我們還和一個(gè)聯(lián)合的研發(fā)項(xiàng)目做了Open Rack V3的機(jī)架,我們有一個(gè)熱啟動(dòng)的液體的冷卻系統(tǒng),剛才咱們已經(jīng)談到了。

我們看一下電源架之所以能夠有目前非常好的架構(gòu),首先我們有相關(guān)的技術(shù)規(guī)范,同時(shí)我們還有一個(gè)電源架的管理中心的控制器,我們也有一個(gè)電源架的48V的輸出的連接器,它能夠成為電源架和總線之間的連接,它能夠使得我們的電源架在整個(gè)總線的任何位置進(jìn)行部署。我們還有一個(gè)通用的7PIN的輸入的連接器,剛才我給大家看到的是目前單獨(dú)研究的Open Rack項(xiàng)目下進(jìn)行研發(fā)的項(xiàng)目,對于Open Rack V3而言我們在今后會(huì)增加更多的功能和配置。

我們看一看下一步將會(huì)做什么呢?下一個(gè)月會(huì)召開一個(gè)工程師會(huì)議,這個(gè)會(huì)議主要是看一下Open Rack Power、先進(jìn)的冷卻系統(tǒng)、數(shù)據(jù)中心三個(gè)聯(lián)合的項(xiàng)目,我們希望在現(xiàn)在部署的情況下提供一致的和可交互的方式,以便我們在進(jìn)行部署的時(shí)候,比如在冷板上面的熱量能夠在我們的數(shù)據(jù)中心做更好的遷移,再有一個(gè)就是關(guān)于我們功率的設(shè)計(jì),現(xiàn)在OCP的這些利益合作伙伴正在幫助我們?nèi)〉眠M(jìn)展,今天我談到的這些話題如果大家感興趣的話,我特別希望大家能夠直接聯(lián)系我,以便我們能共同一起工作。就如同我們現(xiàn)在已經(jīng)取得的技術(shù)規(guī)范方面的進(jìn)展已經(jīng)放到了OCP的網(wǎng)站上,大家感興趣的話可以隨時(shí)看到。如果大家想?yún)⑴c這些項(xiàng)目的話,很顯然你可以放到Make It Power郵件上面去,議程有什么變化或者我們有什么進(jìn)展都將通過郵件發(fā)送給大家。這是我給大家講的一些情況,非常感謝。

名稱欄目:云數(shù)據(jù)中心4類機(jī)架/機(jī)柜設(shè)計(jì)的特征與進(jìn)展
網(wǎng)站鏈接:http://muchs.cn/news/204502.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站網(wǎng)站收錄、定制網(wǎng)站、App開發(fā)虛擬主機(jī)、自適應(yīng)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作