叫板英特爾，英偉達(dá)發(fā)布首個(gè)CpU，集齊“三芯”

AI 與云的結(jié)合，讓其充分發(fā)揮威力。

為寧鄉(xiāng)等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù)，及寧鄉(xiāng)網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為成都網(wǎng)站建設(shè)、網(wǎng)站建設(shè)、寧鄉(xiāng)網(wǎng)站設(shè)計(jì)，以傳統(tǒng)方式定制建設(shè)網(wǎng)站，并提供域名空間備案等一條龍服務(wù)，秉承以專業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求，就會(huì)得到認(rèn)可，從而選擇與我們長(zhǎng)期合作。這樣，我們也可以走得更遠(yuǎn)！

編者按：本文來自微信公眾號(hào)“CSDN”（ID:CSDNnews），作者：馬超，36氪經(jīng)授權(quán)發(fā)布。

昨日，在英偉達(dá)的新品發(fā)布會(huì)大會(huì)上，英偉達(dá) CEO 黃仁勛如期拿出了首款 CpU 芯片 Grace，劍指 AI 云計(jì)算，其實(shí)筆者在前文《英特爾火線換帥、蘋果攪動(dòng)乾坤，國(guó)芯路在何方？》就曾指出，英偉達(dá)收購(gòu) ARM 預(yù)示著 N 廠必然進(jìn)軍 CpU 領(lǐng)域，在云計(jì)算市場(chǎng)有所作為。而本次發(fā)布會(huì)上除了 Grace 之外，英偉達(dá)還發(fā)布了 Transformers 框架——NVIDIA Megatron；藥物研發(fā)加速庫(kù) Clara Discovery 模型等產(chǎn)品，也側(cè)面印證了筆者的觀點(diǎn)，英偉達(dá)正在軟硬齊發(fā)為進(jìn)軍云數(shù)據(jù)中心領(lǐng)域鋪平道路。

無獨(dú)有偶，上周英特爾也發(fā)布了 10nm 的至強(qiáng)三代處理器，在新任 CEO 帕特.基辛格的帶領(lǐng)下，英特爾也要加強(qiáng)自身在云計(jì)算領(lǐng)域的優(yōu)勢(shì)，不過在這場(chǎng)英特爾對(duì)陣英偉達(dá)的“雙英”大戰(zhàn)中，雙方的策略明顯不同，英特爾注重于全面，除了 AI 以外還在安全、虛擬化及調(diào)度能力以及存儲(chǔ)性能等等方面全線開花；但是英偉達(dá)則在專注于 AI 云及低功耗超級(jí)計(jì)算機(jī)幾個(gè)重要領(lǐng)域進(jìn)行定點(diǎn)突破。

雖然目前還無法預(yù)測(cè)“雙英”大戰(zhàn)的結(jié)局，不過 AI 云計(jì)算的發(fā)展空間還是有目共睹的，從最新的 AI 發(fā)展趨勢(shì)來看，最新的人工智能模型對(duì)于算力的要求往往都是非常高，比如可以自動(dòng)寫代碼的 GpT-3 其參數(shù)規(guī)模突破了 1000 億，而 GpT-3 的變種，可以將文字描述轉(zhuǎn)化為圖像的跨模態(tài)生成模型 DALL.E，其模型參數(shù)數(shù)量更是達(dá)到了驚人的 1500 億，不少 AI 方面的科學(xué)家指出，越大的模型往往表現(xiàn)更好，擴(kuò)大規(guī)?？赡苋匀皇菍?shí)現(xiàn)更好性能的方式。用黃仁勛在發(fā)布會(huì)上的話來說“三年間大規(guī)模預(yù)訓(xùn)練模型的參數(shù)量增加了 3000 倍。我們估計(jì)在 2023 年會(huì)出現(xiàn) 100 萬億參數(shù)的模型?！蹦壳百Y金實(shí)力一般的創(chuàng)業(yè)公司將越來越難以通過自身的算力去訓(xùn)練最新、最好的 AI 模型。

從另一個(gè)角度講，AI 模型越來越大的趨勢(shì)也推進(jìn)了 AI 與云的結(jié)合，只有充分發(fā)揮云計(jì)算降本增效的特性，才能降低門檻，促進(jìn) AI 行業(yè)創(chuàng)新性發(fā)展。也只有做好 AI 云，才能讓 AI 充分發(fā)揮威力，體現(xiàn)價(jià)值。我們看到本次英偉達(dá)圍繞著 AI 云計(jì)算，在 CpU、智能駕駛及配套軟件方面同都有不少的進(jìn)展，接下來，本文將為大家逐一進(jìn)行解讀。

Grace 打破內(nèi)存與顯存之間的墻

由于 ARM 使用 RISC 風(fēng)格的精簡(jiǎn)指令集， ARM 核心在指令預(yù)測(cè)等方面同天然比 X86 更有優(yōu)勢(shì)，能耗也比 X86 更低。當(dāng)然這些都是 ARM 相對(duì)于 X86 的傳統(tǒng)優(yōu)勢(shì)，本次 Grace 大的創(chuàng)新點(diǎn)在于把 CpU 與 GpU 之間的通信速度提升了近 10 倍。根據(jù)黃仁勛的說法，“這是一萬名工程人員歷經(jīng)幾年的研發(fā)成果，旨在滿足當(dāng)前世界最先進(jìn)應(yīng)用程序的計(jì)算需求，其具備的計(jì)算性能和吞吐速率是以往任何架構(gòu)所無法比擬的。”

CpU 和 GpU 的通信速度的重要性，可以用蘋果 M1 的例子來加以說明，我們知道蘋果 M1 顯卡與內(nèi)存加在一起只有 16 個(gè) G，對(duì)比上一代 Mac pRO 內(nèi)存128G，光是顯存都有 16G，不過搭載 M1 的入門版 Mac 在進(jìn)行圖像處理等需要 CpU 與 GpU 進(jìn)行協(xié)同的運(yùn)算任務(wù)時(shí)，至少比上一代頂配的 Mac 性能高出近一倍。其中的秘決就是將內(nèi)存與顯卡進(jìn)行統(tǒng)一管理，從而大大提高了 CpU 與 GpU 的通信效率。

當(dāng)然蘋果將內(nèi)存與顯存混用的做法，在云計(jì)算這種多租戶共存的場(chǎng)景下并不太適用，但是現(xiàn)有 GpU 與 CpU 共享內(nèi)存的做法效率確實(shí)不佳，在共享內(nèi)存的方案下，CpU 和 GpU 必須輪流訪問內(nèi)存，這就意味著他們要爭(zhēng)奪數(shù)據(jù)總線的使用權(quán)。因此 GpU 和 CpU 不得不輪流使用一個(gè)狹窄的通信管道來做數(shù)據(jù)交換。而英偉達(dá)的 Grace 在這方面做出了突破性的進(jìn)展。

類似于 DMA 控制器在磁盤與內(nèi)存之間搭建了一條快速通道一樣，Grace 體系中 GpU 核心與 CpU 核心之間的通信不需要 CpU 的調(diào)度，也不需要占用數(shù)據(jù)總線的帶寬，之前 CpU 必須將數(shù)據(jù)從其內(nèi)存的區(qū)域復(fù)制到 GpU 使用的區(qū)域，而在 Grace 的加持下，CpU 只需要告訴GpU在內(nèi)存的某位置有 30Mb 的向量數(shù)據(jù)，然后就可以去做其它事了，GpU 則可以通過 Grace 復(fù)制通道迅速開始計(jì)算任務(wù)。

可以說 Grace 的快速能道基本還在筆者的射程范圍之內(nèi)，而英偉達(dá)馬上要推出的 L5 級(jí)別自動(dòng)駕駛芯片，就只能令人仰望了。

英偉達(dá)自動(dòng)駕駛Orin-劍指L5的雄偉藍(lán)圖

鋼鐵俠馬斯克上周剛剛宣布特斯拉全新的自動(dòng)駕駛系統(tǒng) FSD beta9.0 已經(jīng)接近完成，有消息稱 FSD 的自動(dòng)駕駛能力要達(dá)到 L5 級(jí)，這真是一個(gè)震驚世界的消息，因?yàn)槟壳疤厮估?Autopilot 還沒有達(dá)到 L3 的程度。

在業(yè)界公認(rèn)的自動(dòng)駕駛 L 級(jí)分類標(biāo)準(zhǔn)中，依據(jù)駕駛?cè)蝿?wù)中 AI 與人類的角色分配以及有無設(shè)計(jì)運(yùn)行條件限制等因素，將駕駛自動(dòng)化分成 0 至 5 級(jí)。其中0級(jí)為應(yīng)急輔助級(jí)在應(yīng)急情況下幫助駕駛員進(jìn)行輔助操作，在 0 級(jí)至 2 級(jí)自動(dòng)駕駛中，監(jiān)測(cè)路況并做出反應(yīng)的任務(wù)都由駕駛員和系統(tǒng)共同完成，并需要駕駛員接管動(dòng)態(tài)駕駛?cè)蝿?wù)；3 級(jí)為有條件自動(dòng)駕駛，4 級(jí)高度自動(dòng)駕駛僅在特定條件下需要駕駛員參與；5 級(jí)完全自動(dòng)駕駛的駕駛自動(dòng)化系統(tǒng)在其設(shè)計(jì)運(yùn)行條件內(nèi)，能夠持續(xù)地執(zhí)行全部動(dòng)態(tài)駕駛?cè)蝿?wù)和執(zhí)行動(dòng)態(tài)駕駛?cè)蝿?wù)接管，駕駛員可以完全退化為乘客的角色。

L5 級(jí)別的自動(dòng)駕駛看似不是從0到1的開創(chuàng)性工作，但從實(shí)踐上看，想真正實(shí)現(xiàn)全天候的自動(dòng)駕駛難度極大，從谷歌的公開資料中我們可以知道一臺(tái)自動(dòng)駕駛測(cè)試車輛每天至少會(huì)產(chǎn)生10T的數(shù)據(jù)量，平均每分鐘都要處理幾百M(fèi)的數(shù)據(jù)，而且自動(dòng)駕駛的決策延時(shí)必須要控制得極低，汽車以80公里/小時(shí)的速度運(yùn)行時(shí)其機(jī)械制動(dòng)距離就接近30米，想保證安全留給自動(dòng)駕駛的反應(yīng)時(shí)間通常只有0.1秒，而且作何一點(diǎn)決策上的失誤都可能造成極其嚴(yán)重的后果。

簡(jiǎn)單說 L5 級(jí)別的自動(dòng)駕駛是一個(gè)每秒數(shù)據(jù)處理能力 1 個(gè) G，數(shù)據(jù)處理延時(shí)不能超過0.1s，而且可靠性還不能低于 99.999999% 的極精密系統(tǒng)，再考慮其 AI 模型的上百億個(gè)參數(shù)，這個(gè)系統(tǒng)對(duì)于算力的要求是十分驚人的，不過更驚人的是黃仁勛表示英偉達(dá)就是要干這個(gè)。

根據(jù)計(jì)劃，英偉達(dá)將于 2022 年投產(chǎn)支持 L5 自動(dòng)駕駛的汽車計(jì)算系統(tǒng)級(jí)芯片NVIDIA DRIVE Orin，與此同時(shí)英偉達(dá)還在發(fā)布會(huì)上展示了搭載 3 個(gè) Orin 核心的 Hyperion 8 自動(dòng)駕駛汽車平臺(tái)，據(jù)稱 Hyperion 8 是業(yè)內(nèi)算力最強(qiáng)的自動(dòng)駕駛汽車模板，當(dāng)然這款芯片目前還沒有量產(chǎn)，也沒有具體細(xì)節(jié)的發(fā)布，因此筆者這里只能先對(duì)英偉達(dá)表示 Respect。

AI 軟件的背后：感知智能向認(rèn)知智能的演進(jìn)

從實(shí)現(xiàn)快速計(jì)算、記憶與存儲(chǔ)的“計(jì)算智能”，到識(shí)別處理語音、圖像、視頻的“感知智能”，再到實(shí)現(xiàn)思考、理解、推理和解釋的“認(rèn)知智能”，人工智能發(fā)展的終極目標(biāo)是賦予機(jī)器人類的智慧。近年來，語音識(shí)別、人臉識(shí)別等“感知智能”技術(shù)已相對(duì)成熟，甚至在許多領(lǐng)域已經(jīng)達(dá)到或超出了人類的水平。但這些技術(shù)僅在工具、模型層面實(shí)現(xiàn)了突破，對(duì)諸如需要專家知識(shí)、邏輯推理或者領(lǐng)域遷移等需要去思考、規(guī)劃、聯(lián)想、創(chuàng)作的復(fù)雜任務(wù)時(shí)，表現(xiàn)不佳。不過隨著大數(shù)據(jù)、云計(jì)算、深度學(xué)習(xí)等技術(shù)的蓬勃發(fā)展，探索在如何保持大數(shù)據(jù)智能優(yōu)勢(shì)的同時(shí)，賦予機(jī)器常識(shí)和因果邏輯推理能力，實(shí)現(xiàn)“認(rèn)知智能”，成為當(dāng)下人工智能研究的核心。

從人機(jī)協(xié)作的角度上看，人類在處理抽象化、情緒化、非邏輯性的問題上有著不可逾越的優(yōu)勢(shì)，而大量重復(fù)、海量計(jì)算和海量記憶則是人工智能的強(qiáng)項(xiàng)。而AI目前一個(gè)重要的發(fā)展方向就是讓人機(jī)兩者的強(qiáng)項(xiàng)聯(lián)合，取長(zhǎng)補(bǔ)短，比如金融行業(yè)的呼叫中心需要分析客戶的語氣，在必要時(shí)引入人工服務(wù)；出行類 App 遇到客戶說出某些關(guān)鍵詞時(shí),則需要立刻與 110 人工報(bào)警臺(tái)聯(lián)動(dòng)報(bào)警。這樣的大趨勢(shì)下也就更需要 AI 由單純的感知世界向認(rèn)知世界去進(jìn)行升級(jí)。我們看到阿里、騰訊的論文，近年來在 KDD 及 CVpR 這樣的 AI 頂會(huì)上獲得不俗的成績(jī)，多半也是源于對(duì)于認(rèn)知智能的突破性貢獻(xiàn)，而英偉達(dá)本次推出的與 AI 系統(tǒng)對(duì)應(yīng)的配套軟件中也順應(yīng)了這一潮流。

本次發(fā)布的 Transformers 訓(xùn)練框架 NVIDIA Megatron、Morpheus 數(shù)據(jù)中心安全平臺(tái)、新一代人工智能對(duì)話機(jī)器人 NVIDIA Jarvis、推薦系統(tǒng)是 NVIDIA Merlin、隱私保護(hù)加強(qiáng)的 AI 輔助套件 NVIDIA TAO，從本質(zhì)上講都是認(rèn)知智能的一種體現(xiàn)。

縱觀整場(chǎng)發(fā)布會(huì)，英偉達(dá)真可謂是 AI 與智能駕駛齊飛，CpU 與 GpU 跨界。新時(shí)代的計(jì)算機(jī)需要新的芯片、新的系統(tǒng)架構(gòu)、新的網(wǎng)絡(luò)、新的軟件和工具。英偉達(dá)全新的數(shù)據(jù)中心路線圖已包括 CpU、GpU 和 DpU 三類芯片，將英偉達(dá)也將被重新定義為三芯片公司。

網(wǎng)頁(yè)標(biāo)題：叫板英特爾，英偉達(dá)發(fā)布首個(gè)CpU，集齊“三芯”
分享地址：http://muchs.cn/article36/scsgpg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供全網(wǎng)營(yíng)銷推廣、網(wǎng)站維護(hù)、網(wǎng)頁(yè)設(shè)計(jì)公司、自適應(yīng)網(wǎng)站、企業(yè)建站、網(wǎng)站營(yíng)銷

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容