AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

AI 從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法  

山南ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景,ssl證書未來(lái)市場(chǎng)廣闊!成為創(chuàng)新互聯(lián)公司的ssl證書銷售渠道,可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:13518219792(備注:SSL證書合作)期待與您的合作!

 

摘要: 想要了解人工智能,不知道這十種深度學(xué)習(xí)方法怎么能行?

 

在過(guò)去十年中,人們對(duì) 機(jī)器學(xué)習(xí)的 興趣激增。幾乎每天,我們都可以在各種各樣的計(jì)算機(jī)科學(xué)課程、行業(yè)會(huì)議、華爾街日?qǐng)?bào)等等看到有關(guān)機(jī)器學(xué)習(xí)的討論。在所有關(guān)于機(jī)器學(xué)習(xí)的討論中,許多人把機(jī)器學(xué)習(xí)能做的事情和他們希望機(jī)器學(xué)習(xí)做的事情混為一談。從根本上講,機(jī)器學(xué)習(xí)是使用算法從原始數(shù)據(jù)中提取信息,并在某種類型的模型中表示這些信息。我們使用這個(gè)模型來(lái)推斷還沒(méi)有建模的其他數(shù)據(jù)。

 

神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一種模型,它們至少有50年歷史了。神經(jīng)網(wǎng)絡(luò)的基本單元是節(jié)點(diǎn)(node),基本上是受哺乳動(dòng)物大腦中的生物神經(jīng)元啟發(fā)。神經(jīng)元之間的連接也以生物的大腦為模型,這些連接隨著時(shí)間的推移而發(fā)展的方式是為“訓(xùn)練”。

 

在20世紀(jì)80年代中期和90年代初期,許多重要的模型架構(gòu)進(jìn)步都是在神經(jīng)網(wǎng)絡(luò)中進(jìn)行的。然而,為了獲得良好性能所需的時(shí)間和數(shù)據(jù)越來(lái)越多,這極大的降低了研究人員的興趣。在21世紀(jì)初期,計(jì)算能力呈指數(shù)級(jí)增長(zhǎng),研究人員看到了計(jì)算機(jī)技術(shù)的“寒武紀(jì)爆發(fā)”。作為該領(lǐng)域的一個(gè)重要競(jìng)爭(zhēng)者——深度學(xué)習(xí),因?yàn)橛?jì)算能力的爆炸式增長(zhǎng),贏得了許多重要的機(jī)器學(xué)習(xí)競(jìng)賽。截至目前,這種趨勢(shì)仍然沒(méi)有減退;今天,我們看到機(jī)器學(xué)習(xí)的每個(gè)角落都提到了深度學(xué)習(xí)。

 

為了讓自己趕上潮流,我參加了 Udacity 的“深度學(xué)習(xí)”的課程 ,這個(gè)課程很好的介紹了深度學(xué)習(xí)的動(dòng)機(jī)以及如何從 TensorFlow中學(xué)習(xí)對(duì) 大規(guī)模數(shù)據(jù)集學(xué)習(xí)的智能系統(tǒng)設(shè)計(jì)介紹。在課堂上,我開(kāi)發(fā)了用于圖像識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)、用于自然語(yǔ)言處理的嵌入式神經(jīng)網(wǎng)絡(luò),以及使用循環(huán)神經(jīng)網(wǎng)絡(luò)/長(zhǎng)短期記憶網(wǎng)絡(luò)的字符級(jí)文本生成。你們可以在Jupiter Notebook適用代碼,所有代碼都能在 這個(gè)GitHub 存儲(chǔ)庫(kù)中 找到。

 

最近,我又開(kāi)始閱讀有關(guān)該深度學(xué)習(xí)的學(xué)術(shù)論文。根據(jù)我的研究,以下是一些對(duì)該領(lǐng)域的發(fā)展產(chǎn)生巨大影響的出版物:

? 紐約大學(xué) 基于梯度的學(xué)習(xí)應(yīng)用于文檔識(shí)別 (1998),它將卷積神經(jīng)網(wǎng)絡(luò)引入機(jī)器學(xué)習(xí)世界。

? 多倫多大學(xué)的 Deep Boltzmann Machines (2009),它為Boltzmann機(jī)器提供了一種新的學(xué)習(xí)算法,包含許多隱藏變量層。

? 斯坦福和谷歌 使用大規(guī)模無(wú)監(jiān)督學(xué)習(xí)構(gòu)建高級(jí)功能 (2012),解決了僅使用未標(biāo)記數(shù)據(jù)構(gòu)建高級(jí),類特定功能檢測(cè)器的問(wèn)題。

? Berkeley的 DeCAF-一種用于通用視覺(jué)識(shí)別的深度卷積激活功能 (2013),它發(fā)布了DeCAF,這是 一種深度卷積激活功能 的開(kāi)源實(shí)現(xiàn),以及所有相關(guān)的網(wǎng)絡(luò)參數(shù),使視覺(jué)研究人員能夠進(jìn)行深度實(shí)驗(yàn)跨越一系列視覺(jué)概念學(xué)習(xí)范例的表示。

? DeepMind 使用Deep Reinforcement Learning (2016) 播放Atari ,它提供了第一個(gè)深度學(xué)習(xí)模型,可以使用強(qiáng)化學(xué)習(xí)直接從高維感覺(jué)輸入成功學(xué)習(xí)控制策略。

 

通過(guò)研究和學(xué)習(xí)論文,我學(xué)到了很多關(guān)于深度學(xué)習(xí)的豐富知識(shí)。在這里,我想分享AI工程師可以應(yīng)用于機(jī)器學(xué)習(xí)問(wèn)題的 10種強(qiáng)大的深度學(xué)習(xí)方法 。但首先,讓我們來(lái)定義深度學(xué)習(xí)是什么。深度學(xué)習(xí)對(duì)于許多人來(lái)說(shuō)是一個(gè)挑戰(zhàn),因?yàn)樗男问皆谶^(guò)去十年中逐漸發(fā)生了改變。為了向各位更好的說(shuō)明深層學(xué)習(xí)的地位,下圖說(shuō)明了人工智能,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間關(guān)系的概念。

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法


人工智能領(lǐng)域很廣泛,并且已經(jīng)存在了很長(zhǎng)時(shí)間。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)子集,而機(jī)器學(xué)習(xí)只是人工智能的一個(gè)子領(lǐng)域。將深度學(xué)習(xí)網(wǎng)絡(luò)與之前的前饋多層網(wǎng)絡(luò)進(jìn)行區(qū)分:

? 深度學(xué)習(xí)比以前的網(wǎng)絡(luò)更多的神經(jīng)元;

? 深度學(xué)習(xí)中有更復(fù)雜的連接層的方式;

? “寒武紀(jì)爆炸”的提供的計(jì)算能力;

? 深度學(xué)習(xí)可以自動(dòng)進(jìn)行特征提取。

 

當(dāng)我說(shuō)到“更多神經(jīng)元”時(shí),是指近年來(lái)神經(jīng)元的數(shù)量不斷增加,深度學(xué)習(xí)就可以表示更為復(fù)雜的模型。層也從多層網(wǎng)絡(luò)中每一層的完全連接,進(jìn)化成卷積神經(jīng)網(wǎng)絡(luò)中神經(jīng)元片段的局部連接,以及與遞歸神經(jīng)網(wǎng)絡(luò)中的同一神經(jīng)元的循環(huán)連接(與前一層的連接除外)。

 

深度學(xué)習(xí)可以被定義為具有大量參數(shù)和層數(shù)的神經(jīng)網(wǎng)絡(luò):

? 無(wú)人監(jiān)督的預(yù)訓(xùn)練網(wǎng)絡(luò);

? 卷積神經(jīng)網(wǎng)絡(luò);

? 循環(huán)神經(jīng)網(wǎng)絡(luò);

? 遞歸神經(jīng)網(wǎng)絡(luò)。

 

在這篇文章中,我主要對(duì)后三種網(wǎng)絡(luò)進(jìn)行講解。

 

卷積神經(jīng)網(wǎng)絡(luò)(CNN) 基本上式已經(jīng)跨越使用共享權(quán)重的空間延伸的標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)。CNN旨在通過(guò)在內(nèi)部的卷積來(lái)識(shí)別圖像,該卷積看到圖像上識(shí)別對(duì)象的邊緣。

 

遞歸神經(jīng)網(wǎng)絡(luò)基本上是一個(gè)使用時(shí)間延伸擴(kuò)展空間的標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò),它提取進(jìn)入下一時(shí)間步的邊沿,而不是在同一時(shí)間進(jìn)入下一層。

 

RNN 進(jìn)行序列識(shí)別,例如語(yǔ)音或文本信號(hào),因其內(nèi)部具有循環(huán),意味著在RNN網(wǎng)絡(luò)中存在短時(shí)記憶。遞歸神經(jīng)網(wǎng)絡(luò)更類似于分層網(wǎng)絡(luò),其中輸入序列實(shí)際上與時(shí)間無(wú)關(guān),但輸入必須以樹狀方式分層處理。

 

下面的10種方法可以應(yīng)用于所有這些架構(gòu)。

 

1- 反向傳播

Back-prop 反向傳播只是一種簡(jiǎn)單計(jì)算函數(shù)的偏導(dǎo)數(shù)的方法,它具有函數(shù)組合的形式(如神經(jīng)網(wǎng)絡(luò)中)。當(dāng)你使用基于梯度的方法解決最優(yōu)化問(wèn)題(梯度下降只是其中之一)時(shí),你希望在每次迭代時(shí)計(jì)算函數(shù)漸變,這個(gè)時(shí)候它便可以發(fā)揮作用。

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法


對(duì)于神經(jīng)網(wǎng)絡(luò),其目標(biāo)函數(shù)具有組合的形式。你如何計(jì)算梯度?有兩種常見(jiàn)的方法可以做到:(i) 分析微分法 。如果你知道函數(shù)的形式,你只需使用鏈?zhǔn)揭?guī)則(基本微積分)計(jì)算導(dǎo)數(shù)。(ii) 有限差分的近似微分 。該方法在計(jì)算上是昂貴的,因?yàn)樵u(píng)估函數(shù)的數(shù)量是 O(N) ,其中 N 是參數(shù)的數(shù)量。與解析微分相比,這種方法的計(jì)算成本是昂貴的。在調(diào)試時(shí),通常使用有限差分驗(yàn)證反向傳播的執(zhí)行效果。

 

 

2- 隨機(jī)梯度下降

想象梯度下降的直觀方式是想象一條源自山頂?shù)暮恿鞯穆窂?。梯度下降的目?biāo)正是河流努力實(shí)現(xiàn)的目標(biāo),即從山頂流到最低點(diǎn)。

 

現(xiàn)在,如果山的地形形狀使得河流在到達(dá)其最終目的地之前不必完全停在任何地方,這是我們想要的理想情況。在機(jī)器學(xué)習(xí)中,這相當(dāng)于說(shuō),我們已經(jīng)從初始點(diǎn)(山頂)開(kāi)始找到解決方案的全局最小值(或最優(yōu)值)。然而,可能由于地形性質(zhì),導(dǎo)致河流路徑出現(xiàn)若干的坑洼,會(huì)迫使河流困住和停滯。在機(jī)器學(xué)習(xí)方面,這種坑洼被稱為局部最優(yōu)解,這是我們不想要的情況。當(dāng)然有很多方法可以解決局部最優(yōu)解問(wèn)題,這里我不打算進(jìn)一步討論。

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法


因此,梯度下降傾向于陷入局部最小值,這取決于地形的性質(zhì)(或ML術(shù)語(yǔ)中的函數(shù))。但是,當(dāng)你有一種特殊的山地形狀(形狀像一個(gè)碗,用ML術(shù)語(yǔ)稱為凸函數(shù))時(shí),算法始終能夠找到最優(yōu)值。你可以想象將這條河流可視化。在機(jī)器學(xué)習(xí)中,這些特殊的地形(也稱為凸函數(shù))總是需要優(yōu)化的。另外,你從山頂開(kāi)始(即函數(shù)的初始值)的位置不同,最終你到達(dá)山底的路徑也完全不同。同樣,根據(jù)河流的流淌速度(即梯度下降算法的學(xué)習(xí)速率或步長(zhǎng)),你可能會(huì)以不同的方式到達(dá)目的地。你是否會(huì)陷入或避免一個(gè)坑(局部最?。紩?huì)被這兩個(gè)標(biāo)準(zhǔn)影響。

 

 

3- 學(xué)習(xí)速率衰減

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法


調(diào)整隨機(jī)梯度下降優(yōu)化程序的學(xué)習(xí)速率可以提高性能并縮短訓(xùn)練時(shí)間。有時(shí)這也被稱為學(xué)習(xí)率退火或自適應(yīng)學(xué)習(xí)率。在訓(xùn)練期間最簡(jiǎn)單且最常用的學(xué)習(xí)率調(diào)整是隨時(shí)間降低學(xué)習(xí)率的技術(shù)。在訓(xùn)練初期使用較大的學(xué)習(xí)速率值,可以對(duì)學(xué)習(xí)速率進(jìn)行大幅調(diào)整;在訓(xùn)練后期,降低學(xué)習(xí)速率,使模型以一個(gè)較小的速率進(jìn)行權(quán)重的更新。這種技術(shù)在早期可以快速學(xué)習(xí)獲得一些較好的權(quán)重,并在后期對(duì)權(quán)重進(jìn)行微調(diào)。

 

兩種流行且易于使用的學(xué)習(xí)率衰減如下:

? 在每個(gè)環(huán)節(jié)逐漸降低學(xué)習(xí)率。

? 在特定時(shí)期使用大幅下降來(lái)降低學(xué)習(xí)速率。

 

 

4-Dropout

具有大量參數(shù)的深度神經(jīng)網(wǎng)絡(luò)是非常強(qiáng)大的機(jī)器學(xué)習(xí)系統(tǒng)。然而,過(guò)度擬合是這種網(wǎng)絡(luò)中的嚴(yán)重問(wèn)題。大型網(wǎng)絡(luò)使用起來(lái)也很慢,因此在測(cè)試時(shí)將許多不同的大型神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)合起來(lái)很難處理過(guò)度擬合。Dropout就是一種解決此問(wèn)題的技術(shù)。

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法


關(guān)鍵思想是在訓(xùn)練期間從神經(jīng)網(wǎng)絡(luò)中隨機(jī)刪除單元及其連接,這可以防止單元間的過(guò)度適應(yīng)。在訓(xùn)練期間,從指數(shù)數(shù)量的不同“稀疏”網(wǎng)絡(luò)中抽取樣本。在測(cè)試時(shí),通過(guò)簡(jiǎn)單地使用具有較小權(quán)重的單解開(kāi)網(wǎng)絡(luò)(untwinednetwork),很容易近似平均所有這些稀疏網(wǎng)絡(luò)以達(dá)到預(yù)測(cè)的效果。這顯著減少了過(guò)度擬合,并且比其他正則化方法表現(xiàn)的更好。

 

Dropout 已被證明可以改善神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué),語(yǔ)音識(shí)別,文檔分類和計(jì)算生物學(xué)等領(lǐng)域的監(jiān)督學(xué)習(xí)任務(wù)的性能,并在許多基準(zhǔn)數(shù)據(jù)集上獲得最先進(jìn)的結(jié)果。

 

 

5- 最大池化

最大池化是基于樣本的離散化過(guò)程。目的是對(duì)輸入表示(圖像、隱藏層輸出矩陣等)進(jìn)行下采樣,通過(guò)降低其維數(shù)并允許對(duì)包含在子區(qū)域中的特征進(jìn)行合并。

 

通過(guò)提供表征的抽象形式,這種方法在某種程度上有助于解決過(guò)擬合。同樣,它也通過(guò)減少學(xué)習(xí)參數(shù)的數(shù)量和提供基本的內(nèi)部表征的轉(zhuǎn)換不變性來(lái)減少計(jì)算量。最大池化是通過(guò)將最大過(guò)濾器應(yīng)用于通常不重疊的初始表征子區(qū)域來(lái)完成的。

 

6- 批量歸一化

當(dāng)然,包括深度網(wǎng)絡(luò)在內(nèi)的神經(jīng)網(wǎng)絡(luò)需要仔細(xì)調(diào)整權(quán)重初始化和學(xué)習(xí)參數(shù)。批量歸一化有助于讓中國(guó)過(guò)程更簡(jiǎn)單一點(diǎn)。

 

權(quán)重問(wèn)題:

· 無(wú)論那種權(quán)重的初始化,隨機(jī)還是憑經(jīng)驗(yàn)選擇,它們都和學(xué)習(xí)權(quán)重差別很大??紤]一個(gè)小批量數(shù)據(jù)集,在最初的時(shí)期,在特征激活時(shí)都會(huì)有許多異常值。

· 深度神經(jīng)網(wǎng)絡(luò)本身脆弱的,即初始層的微小擾動(dòng)都會(huì)導(dǎo)致后面層很大的變化。

 

在反向傳播期間,這些現(xiàn)象會(huì)導(dǎo)致梯度偏移,這意味著在學(xué)習(xí)權(quán)重以產(chǎn)生所需輸出之前,梯度必須補(bǔ)償異常值。這也將導(dǎo)致需要額外的時(shí)間來(lái)收斂。

 

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

 

批量歸一化將這些梯度從離散規(guī)則化為正常值,并在小批量的范圍內(nèi)朝向共同目標(biāo)(通過(guò)歸一化它們)流動(dòng)。

 

學(xué)習(xí)率問(wèn)題: 通常,學(xué)習(xí)率保持較小,使得只有一小部分的梯度用來(lái)校正權(quán)重,原因是異常激活的梯度不應(yīng)該影響已經(jīng)學(xué)習(xí)好的權(quán)重。通過(guò)批量歸一化,這些異常值被激活的可能性就會(huì)減少,因此可以使用更高的學(xué)習(xí)率來(lái)加速學(xué)習(xí)過(guò)程。

 

7- 長(zhǎng)短期記憶:

LSTM 網(wǎng)絡(luò)具有以下三個(gè)方面,使其與遞歸神經(jīng)網(wǎng)絡(luò)中的常規(guī)神經(jīng)元區(qū)分開(kāi)來(lái):

1 、它可以控制何時(shí)讓輸入進(jìn)入神經(jīng)元。

2 、它可以控制何時(shí)記住上一個(gè)時(shí)間步驟中計(jì)算的內(nèi)容。

3 、它可以控制何時(shí)將輸出傳遞給下一個(gè)時(shí)間戳。

 

LSTM 的優(yōu)點(diǎn)在于它根據(jù)當(dāng)前輸入本身決定所有這些,如下圖所示:

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

 

當(dāng)前時(shí)間戳處的輸入信號(hào)x(t)決定所有上述3個(gè)點(diǎn)。輸入門決定點(diǎn)1.遺忘門在點(diǎn)2上做出決定,輸出門在點(diǎn)3上做出決定。輸入門能單獨(dú)能夠做出這三個(gè)決定。這受到了我們的大腦是如何工作的啟發(fā),并且可以處理突然的上下文切換。

 

8-Skip-gram :

詞嵌入模型的目標(biāo)是為了每個(gè)詞匯學(xué)習(xí)一個(gè)高維密集表征,其中嵌入向量之間的相似性顯示了相應(yīng)單詞之間的語(yǔ)義或句法相似性。Skip-gram是學(xué)習(xí)詞嵌入算法的模型。

 

skip-gram 模型(以及許多其他詞嵌入模型)背后的主要思想如下:如果兩個(gè)詞匯有相似的上下文,則它們是相似的。

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

 

換句話說(shuō),假設(shè)你有一句話,比如“貓是哺乳動(dòng)物”。如果你使用術(shù)語(yǔ)“狗”而不是“貓”,句子仍然是一個(gè)有意義的句子。因此在該示例中,“狗”和“貓”可以共享相同的背景(即“是哺乳動(dòng)物”)。

 

基于上述假設(shè),你可以考慮一個(gè)上下文窗口(一個(gè)包含k個(gè)連續(xù)術(shù)語(yǔ)的窗口)。然后你應(yīng)該跳過(guò)其中一個(gè)單詞,并嘗試學(xué)習(xí)除了跳過(guò)的一個(gè)術(shù)語(yǔ)之外的所有術(shù)語(yǔ)并預(yù)測(cè)跳過(guò)的術(shù)語(yǔ)的神經(jīng)網(wǎng)絡(luò)。因此如果兩個(gè)單詞在大型語(yǔ)料庫(kù)中重復(fù)地共享相似的上下文,那些這些術(shù)語(yǔ)的嵌入向量將具有相似的向量。

 

 

9- 連續(xù)的詞袋模型(Continuous Bag of Words):

在自然語(yǔ)言處理問(wèn)題中,我們希望學(xué)習(xí)將文檔中的每個(gè)單詞表示為數(shù)字向量,使得出現(xiàn)在相似上下文中的單詞具有彼此接近的向量。在連續(xù)詞袋模型中,目標(biāo)是能夠使用圍繞特定單詞的上下文并預(yù)測(cè)特定單詞。

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

 

我們通過(guò)在一個(gè)大型語(yǔ)料庫(kù)中抽取大量句子來(lái)做到這一點(diǎn),每次看到一個(gè)單詞時(shí),我們都會(huì)使用其上下文單詞。然后我們將上下文單詞輸入到一個(gè)神經(jīng)網(wǎng)絡(luò)中,并預(yù)測(cè)該上下文中心的單詞。

 

當(dāng)我們有數(shù)千個(gè)這樣的上下文單詞和中心單詞時(shí),我們就有一個(gè)神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)集的實(shí)例。我們訓(xùn)練神經(jīng)網(wǎng)絡(luò),在經(jīng)過(guò)編碼的隱藏層的輸出表示特定單詞的嵌入。碰巧的是,當(dāng)我們?cè)诖罅烤渥由嫌?xùn)練時(shí),類似上下文中的單詞會(huì)得到類似的向量。

 

10- 遷移學(xué)習(xí):

考慮下圖像是如何通過(guò)卷積神經(jīng)網(wǎng)絡(luò)的。假設(shè)你有一個(gè)圖像,你應(yīng)用卷積,你得到像素組合作為輸出。如果碰到了邊緣,則再次應(yīng)用卷積,所以現(xiàn)在輸出是邊或線的組合。然后再次應(yīng)用卷積,此時(shí)的輸出將是線的組合,依此類推。你可以將其視為每個(gè)層尋找特定模式。神經(jīng)網(wǎng)絡(luò)的最后一層往往變得非常專業(yè)。如果你正在使用ImageNet,那么你的網(wǎng)絡(luò)最后一層將尋找兒童或狗或飛機(jī)或其他什么。再后退幾層你可能會(huì)看到網(wǎng)絡(luò)正在尋找眼睛或耳朵或嘴或輪子。

  AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

 

深度CNN中的每個(gè)層逐漸建立了更高和更高級(jí)別的特征表征。最后幾層往往專注于你輸入模型的任何數(shù)據(jù)。另一方面,早期的圖層更通用,是在更大類的圖片中找到很多簡(jiǎn)單的模式。


遷移學(xué)習(xí)是指你在一個(gè)數(shù)據(jù)集上訓(xùn)練CNN,切斷最后一層,在其他不同的數(shù)據(jù)集上重新訓(xùn)練模型的最后一層。直觀地說(shuō),你正在重新訓(xùn)練模型以識(shí)別不同的更高級(jí)別的功能。因此,模型訓(xùn)練的時(shí)間會(huì)大大減少,因此當(dāng)你沒(méi)有足夠的數(shù)據(jù)或者訓(xùn)練所需的太多資源時(shí),遷移學(xué)習(xí)是一種有用的工具。

 

本文僅顯示這些方法的一般概述。我建議閱讀以下文章以獲得更詳細(xì)的解釋:

· Andrew Beam的 “深度學(xué)習(xí)101” ;

· 安德烈?guī)炝挚品虻? “神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)簡(jiǎn)史” ;

· Adit Deshpande的 “理解卷積神經(jīng)網(wǎng)絡(luò)的初學(xué)者指南”

· 克里斯奧拉的 “理解LSTM 網(wǎng)絡(luò)” ;

· Algobean的 “人工神經(jīng)網(wǎng)絡(luò)”

· Andrej Karpathy的 回歸 神經(jīng)網(wǎng)絡(luò)的不合理有效性” ;

 

 

深度學(xué)習(xí)是非常注重技術(shù)實(shí)踐的。本文中的每個(gè)新想法都沒(méi)有太多具體的解釋。對(duì)于大多數(shù)新想法都附帶了實(shí)驗(yàn)結(jié)果來(lái)證明它們能夠運(yùn)作。深度學(xué)習(xí)就像玩樂(lè)高,掌握樂(lè)高與任何其他藝術(shù)一樣具有挑戰(zhàn)性,但相比之下入門樂(lè)高是容易的。

 

轉(zhuǎn)自: https://www.cnblogs.com/DicksonJYL/p/9591732.html


網(wǎng)站題目:AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法
轉(zhuǎn)載源于:http://muchs.cn/article30/pgosso.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站改版小程序開(kāi)發(fā)、定制網(wǎng)站網(wǎng)站建設(shè)、域名注冊(cè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都app開(kāi)發(fā)公司