大數(shù)據(jù)AND機(jī)器學(xué)習(xí):大數(shù)據(jù)是原材料,機(jī)器學(xué)習(xí)是原材料加工廠

互聯(lián)網(wǎng)IDC圈4月18日?qǐng)?bào)道,在Deepmind和AlphaGo獲得的巨大成功吸引了全世界的目光的同時(shí),新一代人工智能德大戰(zhàn)已經(jīng)開(kāi)始。

創(chuàng)新互聯(lián)是專業(yè)的古丈網(wǎng)站建設(shè)公司,古丈接單;提供成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì),網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行古丈網(wǎng)站開(kāi)發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛(ài)的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!

Deepmind之前開(kāi)發(fā)的玩雅達(dá)利(Atari)街機(jī)游戲的人工智能是全新一代的智能技術(shù)——大數(shù)據(jù)驅(qū)動(dòng)通用人工智能(Big Data-driven Artificial General Intelligence)。

就像這個(gè)名字所提到的,這里有兩個(gè)重要的因素,一是“大數(shù)據(jù)”驅(qū)動(dòng),二是通用人工智能。大數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)使得機(jī)器盡量脫離人類的經(jīng)驗(yàn)指導(dǎo),自動(dòng)在海量數(shù)據(jù)和工作環(huán)境中挖掘知識(shí)取得進(jìn)步。而通用人工智能基于端對(duì)端(end-to-end)的深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning),幫助機(jī)器能在不同的任務(wù)中共享一套學(xué)習(xí)框架,無(wú)需人類進(jìn)一步調(diào)試。

這兩個(gè)因素同時(shí)作用出一個(gè)效果,即人需要的干預(yù)越來(lái)越少,而機(jī)器在與環(huán)境交互反饋中的自主學(xué)習(xí)比重越來(lái)越大。

“大數(shù)據(jù)”驅(qū)動(dòng)的機(jī)器學(xué)習(xí)

AlphaGo的圍棋棋力來(lái)自于30萬(wàn)張人類對(duì)弈棋譜以及3千萬(wàn)次自我對(duì)弈,這是一個(gè)典型的大數(shù)據(jù)機(jī)器學(xué)習(xí)產(chǎn)物。

相比之下,1996年擊敗國(guó)際象棋大師卡斯帕羅夫的IBM深藍(lán)(Deep Blue)人工智能,其依賴的是大量人類總結(jié)出來(lái)的走子規(guī)則的手動(dòng)輸入,以及基于超級(jí)計(jì)算機(jī)每秒上億次搜索的全寬度(full-width)搜索解決方案。

簡(jiǎn)單地說(shuō),深藍(lán)的人工智能相當(dāng)于人類把自己下象棋的知識(shí)和經(jīng)驗(yàn)手動(dòng)輸入電腦中,而AlphaGo的人工智能是人類把一堆棋譜“丟”給電腦,后者自己學(xué)習(xí)總結(jié)出來(lái)甚至進(jìn)一步超出人類圍棋認(rèn)知范疇的知識(shí)。

基于機(jī)器學(xué)習(xí)來(lái)搭建人工智能,人類不需要通過(guò)顯示地編程來(lái)教機(jī)器如何工作,而是給出一個(gè)學(xué)習(xí)框架,告訴機(jī)器如何根據(jù)自身當(dāng)前設(shè)置以及提取環(huán)境的反饋去進(jìn)一步更新參數(shù),進(jìn)而達(dá)到一個(gè)更好的工作表現(xiàn)。

然后人類只需要把大量數(shù)據(jù)“喂”進(jìn)機(jī)器,機(jī)器就可以不斷學(xué)習(xí)不斷優(yōu)化自身的參數(shù)了。這樣,人類就不需要自己首先去總結(jié)經(jīng)驗(yàn)再交給機(jī)器,而是變成了“甩手掌柜”,在一邊看著機(jī)器學(xué)習(xí)起來(lái)就行。

隨著機(jī)器學(xué)習(xí)的模型先進(jìn)性以及機(jī)器處理大數(shù)據(jù)的能力不斷升級(jí),基于大數(shù)據(jù)的人工智能已經(jīng)在人們的生活當(dāng)中扮演越來(lái)越重要的角色。

過(guò)去10年間,基于大數(shù)據(jù)的人工智能已經(jīng)在各個(gè)領(lǐng)域展露頭角,包括在線廣告的精準(zhǔn)投放、搜索引擎?zhèn)€性化網(wǎng)頁(yè)排序、電商的個(gè)性化商品推薦、社交網(wǎng)絡(luò)的好友建議、人臉識(shí)別、圖像識(shí)別、自然語(yǔ)言理解、機(jī)器翻譯、語(yǔ)音識(shí)別、無(wú)人機(jī)跟蹤技術(shù)、汽車自動(dòng)駕駛等等。

很明顯,未來(lái)的10年內(nèi),越來(lái)越多的應(yīng)用場(chǎng)景會(huì)裝配上人工智能,而且機(jī)器會(huì)不斷學(xué)習(xí),做得越來(lái)越好。

通用人工智能

Deepmind和其它做機(jī)器學(xué)習(xí)的科技公司的不同在于它提出來(lái)的通用人工智能(Artificial General Intelligence)的概念和產(chǎn)品。通用人工智能背后的技術(shù)是深度強(qiáng)化學(xué)習(xí),其主要有兩個(gè)特點(diǎn),一是端對(duì)端(end-to-end)的學(xué)習(xí),二是自適應(yīng), 無(wú)需人類調(diào)參而勝任不同的任務(wù)。

Deepmind之前推出的玩街機(jī)游戲的通用人工智能技術(shù)就完美地詮釋了這兩個(gè)特點(diǎn)。

首先,機(jī)器的輸入直接是游戲屏幕的像素,不需要任何特征設(shè)計(jì)和編碼。這里要?dú)w功于最近4年來(lái)名聲大噪的深度學(xué)習(xí)技術(shù)。深度學(xué)習(xí)通過(guò)建立較深層數(shù)的人工神經(jīng)網(wǎng)絡(luò)模型,使機(jī)器能夠自動(dòng)從原始輸入信息中提取、學(xué)習(xí)出適用于預(yù)測(cè)、決策的高層特征。

例如在人臉識(shí)別這一場(chǎng)景中,深度卷積網(wǎng)絡(luò)(deep convolutional networks)輸入層得到圖片像素本身,底層網(wǎng)絡(luò)學(xué)習(xí)出點(diǎn)、直線、曲線、拐角等初級(jí)特征,中層網(wǎng)絡(luò)在這些點(diǎn)、線、角的基礎(chǔ)上學(xué)習(xí)出眼睛、鼻子、嘴等器官特征,高層網(wǎng)絡(luò)則進(jìn)一步組合這些器官特征判斷出圖片是否包含人臉。

其次,同樣設(shè)置的機(jī)器可以做不同的任務(wù),只要“喂”進(jìn)去的數(shù)據(jù)不同,無(wú)需人類調(diào)參或者只需要極小的人類工作花銷。Deepmind使用同一個(gè)深度Q學(xué)習(xí)網(wǎng)絡(luò)(DQN,deep-q-network)模型可以玩不同的街機(jī)游戲,只需要讓機(jī)器玩某個(gè)游戲幾天,它就能學(xué)會(huì)并超過(guò)人類玩家。

通用人工智能可以理解為是在強(qiáng)化學(xué)習(xí)的框架下,結(jié)合其在不同任務(wù)下的適應(yīng)性、模型零耦合(model-free)的優(yōu)勢(shì)和深度學(xué)習(xí)的特征自動(dòng)提取的優(yōu)勢(shì),實(shí)現(xiàn)出的能勝任多種任務(wù)端對(duì)端學(xué)習(xí)的超級(jí)人工智能。這已經(jīng)十分接近人類學(xué)習(xí)和工作的方式了。

正是由于以上兩點(diǎn)優(yōu)勢(shì),人類在開(kāi)發(fā)新一代人工智能的過(guò)程中需要做的干涉越來(lái)越少,交給機(jī)器去自動(dòng)完善的學(xué)習(xí)比重越來(lái)越大,這為人工智能的工作水平的提升以及在各個(gè)領(lǐng)域的普及帶來(lái)了本質(zhì)的飛躍。

萬(wàn)物互聯(lián)的人工智能時(shí)代

最近這三年,我們總是被各種耀眼的技術(shù)詞匯轟炸著:大數(shù)據(jù)、機(jī)器學(xué)習(xí)、人工智能、物聯(lián)網(wǎng)、工業(yè)4.0、互聯(lián)網(wǎng)+…… 我認(rèn)為,這些五花八門的詞匯其實(shí)都在指向同一個(gè)未來(lái):一個(gè)萬(wàn)物互聯(lián)的人工智能時(shí)代。

我希望從三個(gè)維度上的趨勢(shì)來(lái)解釋這個(gè)觀點(diǎn):互聯(lián)化、數(shù)據(jù)化和智能化。

互聯(lián)化是指我們真實(shí)世界的設(shè)備與設(shè)備互聯(lián),而不只是一臺(tái)服務(wù)器上的網(wǎng)站和另一臺(tái)服務(wù)器的網(wǎng)站相連。以汽車舉例,我們的汽車可以連接到家里的空調(diào),這樣我們?cè)诨丶业穆飞暇涂梢园l(fā)出指令啟動(dòng)房間里的空調(diào);汽車也可以和路邊的建筑設(shè)施互聯(lián),找到適合的停車位或者商場(chǎng)中的服務(wù)。

汽車之間也可以互聯(lián),通訊汽車間距、速度等信息,自動(dòng)保障行車安全。這就是物聯(lián)網(wǎng)(在汽車垂直領(lǐng)域稱作車聯(lián)網(wǎng)),其在制造業(yè)的應(yīng)用被德國(guó)稱為工業(yè)4.0,在生活上的應(yīng)用則被我們中國(guó)稱為互聯(lián)網(wǎng)+。

數(shù)據(jù)化是指盡可能多的設(shè)備信息、工作狀態(tài)被量化成數(shù)據(jù)并可在設(shè)備之間通訊。同樣舉汽車的例子,司機(jī)每天開(kāi)車的路徑、其中各個(gè)地點(diǎn)的速度、加速度、油門深淺、剎車輕重、路況等信息都可以通過(guò)傳感器產(chǎn)生可記錄、通訊和分析的數(shù)據(jù)。

目前,以特斯拉為代表的新能源汽車已經(jīng)在數(shù)據(jù)化進(jìn)程上走得很遠(yuǎn)了。其他領(lǐng)域,例如家居、健康,也在推進(jìn)數(shù)據(jù)化進(jìn)程。由于越來(lái)越多的設(shè)備互聯(lián),各個(gè)設(shè)備的狀態(tài)也進(jìn)一步數(shù)據(jù)化,人類在接下來(lái)的10年內(nèi)產(chǎn)生的數(shù)據(jù)量將會(huì)比互聯(lián)網(wǎng)時(shí)代更上一個(gè)新臺(tái)階。

從大數(shù)據(jù)的角度來(lái)講,“大”不但指數(shù)據(jù)規(guī)模大,更指的是數(shù)據(jù)維度高。而設(shè)備的互聯(lián)化和數(shù)據(jù)化將會(huì)產(chǎn)生比當(dāng)今互聯(lián)網(wǎng)大數(shù)據(jù)更加名副其實(shí)的大數(shù)據(jù)。

智能化則是在設(shè)備互聯(lián)化、數(shù)據(jù)化的基礎(chǔ)上通過(guò)數(shù)據(jù)驅(qū)動(dòng)的人工智能解決各種各樣的快速有效的預(yù)測(cè)和決策問(wèn)題。從機(jī)器學(xué)習(xí)的角度來(lái)講,用于訓(xùn)練的數(shù)據(jù)規(guī)模越大、維度越高,就越能學(xué)習(xí)出更復(fù)雜的高級(jí)模型,勝任更高難度的智能工作。

大數(shù)據(jù)是原材料,機(jī)器學(xué)習(xí)是原材料加工廠,而新一代人工智能服務(wù)則是工廠出爐的產(chǎn)品被消費(fèi)在越來(lái)越多的日常生活中。我們看到最近這三年這樣一個(gè)新型產(chǎn)業(yè)鏈的每個(gè)環(huán)節(jié)都在蓬勃發(fā)展,而在AlphaGo戰(zhàn)勝李世石的今天,更多的人開(kāi)始注意到這條產(chǎn)業(yè)鏈帶來(lái)的人工智能產(chǎn)品將會(huì)在未來(lái)10年間給人們的生活帶來(lái)翻天覆地的改善。

學(xué)術(shù)界與產(chǎn)業(yè)界雙贏

結(jié)合真實(shí)大數(shù)據(jù)并在人們?nèi)粘I钪邪l(fā)揮作用的人工智能研究是目前最有效率并最符合整個(gè)產(chǎn)業(yè)鏈發(fā)展趨勢(shì)的研究方式。研究大數(shù)據(jù)驅(qū)動(dòng)的人工智能,首先得有“活的”大數(shù)據(jù)可供研究,才在真實(shí)環(huán)境中不斷嘗試研發(fā)新的人工智能模型。

這樣一個(gè)交互式的研究環(huán)境最能夠促進(jìn)新成果的誕生。這也是當(dāng)今許多世界級(jí)并且?jiàn)^戰(zhàn)在人工智能研究一線的大學(xué)教授會(huì)選擇在一家科技企業(yè)兼職的原因。

而幾年前高校的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)研究仍然傾向于靠著一個(gè)許多年前生成的數(shù)據(jù)集不斷地測(cè)試新模型。從實(shí)踐經(jīng)驗(yàn)來(lái)看,這樣工作在一個(gè)老的小數(shù)據(jù)集上的模型很難勝任現(xiàn)實(shí)生活中的大規(guī)模動(dòng)態(tài)數(shù)據(jù)。而高校實(shí)驗(yàn)室需要作出最前沿的人工智能技術(shù)就需要奮斗在大數(shù)據(jù)處理的第一線。“Get hands dirty。”這樣才能切身感受到最真實(shí)最野性的數(shù)據(jù),才能真正理解數(shù)據(jù)和基于數(shù)據(jù)搭建起來(lái)的人工智能。

我認(rèn)為在大數(shù)據(jù)驅(qū)動(dòng)的人工智能研究中,大學(xué)科研團(tuán)隊(duì)與工業(yè)界算法團(tuán)隊(duì)相比,其優(yōu)勢(shì)在于能將主要精力投入在算法研究中,能在擁有大數(shù)據(jù)和測(cè)試平臺(tái)的基礎(chǔ)上,產(chǎn)出一般企業(yè)想不到的有效算法;另外大學(xué)研究者由于長(zhǎng)期保持相關(guān)文獻(xiàn)的收集整理,對(duì)領(lǐng)域內(nèi)的最新技術(shù)以及新舊技術(shù)的全局理解有很深的體會(huì)。

大數(shù)據(jù)驅(qū)動(dòng)的人工智能是一個(gè)產(chǎn)業(yè)界和學(xué)術(shù)界雙贏合作的領(lǐng)域。

我在倫敦大學(xué)學(xué)院的博士課題是互聯(lián)網(wǎng)精準(zhǔn)展示廣告算法。互聯(lián)網(wǎng)廣告領(lǐng)域的數(shù)據(jù)由于涉及廣告拍賣交易中的價(jià)格信息而十分敏感,所以該領(lǐng)域在2012年之前并不存在任何互聯(lián)網(wǎng)廣告領(lǐng)域的公開(kāi)數(shù)據(jù)集可供高校研究者做研究。該領(lǐng)域絕大多數(shù)研究論文皆來(lái)自涉足互聯(lián)網(wǎng)廣告的科技公司,例如谷歌、微軟、雅虎等等。

對(duì)于高校研究者來(lái)說(shuō),做互聯(lián)網(wǎng)廣告大數(shù)據(jù)的研究,首要任務(wù)就是同相關(guān)企業(yè)建立研究合作,獲取最新的廣告投放數(shù)據(jù),并在合作企業(yè)的商業(yè)平臺(tái)上直接做面向真實(shí)用戶流量的實(shí)驗(yàn)。我們研究組在倫敦、北京和硅谷尋找到了多家廣告科技企業(yè)進(jìn)行合作,其中既有業(yè)務(wù)量和數(shù)據(jù)龐大的IT巨人,也有迭代速度極快的初創(chuàng)公司。

我在博士期間發(fā)表的數(shù)篇互聯(lián)網(wǎng)廣告技術(shù)方面的論文,都包含了在這些企業(yè)平臺(tái)上做的在線實(shí)驗(yàn)。我也在和企業(yè)的交互中學(xué)習(xí)到了很多在高校實(shí)驗(yàn)室無(wú)法接觸到的實(shí)踐經(jīng)驗(yàn)。根據(jù)我們的研究產(chǎn)出,合作的企業(yè)也都有效提升了廣告投放的效益。

本文標(biāo)題:大數(shù)據(jù)AND機(jī)器學(xué)習(xí):大數(shù)據(jù)是原材料,機(jī)器學(xué)習(xí)是原材料加工廠
網(wǎng)站路徑:http://muchs.cn/article34/soghpe.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、網(wǎng)頁(yè)設(shè)計(jì)公司、關(guān)鍵詞優(yōu)化、企業(yè)建站、自適應(yīng)網(wǎng)站、外貿(mào)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

營(yíng)銷型網(wǎng)站建設(shè)