AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

AI 從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

山南ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景，ssl證書未來(lái)市場(chǎng)廣闊！成為創(chuàng)新互聯(lián)公司的ssl證書銷售渠道，可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠！如果有意向歡迎電話聯(lián)系或者加微信：13518219792（備注：SSL證書合作）期待與您的合作！

摘要： 想要了解人工智能，不知道這十種深度學(xué)習(xí)方法怎么能行？

在過(guò)去十年中，人們對(duì) 機(jī)器學(xué)習(xí)的 興趣激增。幾乎每天，我們都可以在各種各樣的計(jì)算機(jī)科學(xué)課程、行業(yè)會(huì)議、華爾街日?qǐng)?bào)等等看到有關(guān)機(jī)器學(xué)習(xí)的討論。在所有關(guān)于機(jī)器學(xué)習(xí)的討論中，許多人把機(jī)器學(xué)習(xí)能做的事情和他們希望機(jī)器學(xué)習(xí)做的事情混為一談。從根本上講，機(jī)器學(xué)習(xí)是使用算法從原始數(shù)據(jù)中提取信息，并在某種類型的模型中表示這些信息。我們使用這個(gè)模型來(lái)推斷還沒(méi)有建模的其他數(shù)據(jù)。

神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一種模型，它們至少有50年歷史了。神經(jīng)網(wǎng)絡(luò)的基本單元是節(jié)點(diǎn)（node），基本上是受哺乳動(dòng)物大腦中的生物神經(jīng)元啟發(fā)。神經(jīng)元之間的連接也以生物的大腦為模型，這些連接隨著時(shí)間的推移而發(fā)展的方式是為“訓(xùn)練”。

在20世紀(jì)80年代中期和90年代初期，許多重要的模型架構(gòu)進(jìn)步都是在神經(jīng)網(wǎng)絡(luò)中進(jìn)行的。然而，為了獲得良好性能所需的時(shí)間和數(shù)據(jù)越來(lái)越多，這極大的降低了研究人員的興趣。在21世紀(jì)初期，計(jì)算能力呈指數(shù)級(jí)增長(zhǎng)，研究人員看到了計(jì)算機(jī)技術(shù)的“寒武紀(jì)爆發(fā)”。作為該領(lǐng)域的一個(gè)重要競(jìng)爭(zhēng)者——深度學(xué)習(xí)，因?yàn)橛?jì)算能力的爆炸式增長(zhǎng)，贏得了許多重要的機(jī)器學(xué)習(xí)競(jìng)賽。截至目前，這種趨勢(shì)仍然沒(méi)有減退;今天，我們看到機(jī)器學(xué)習(xí)的每個(gè)角落都提到了深度學(xué)習(xí)。

為了讓自己趕上潮流，我參加了 Udacity 的“深度學(xué)習(xí)”的課程 ，這個(gè)課程很好的介紹了深度學(xué)習(xí)的動(dòng)機(jī)以及如何從 TensorFlow中學(xué)習(xí)對(duì) 大規(guī)模數(shù)據(jù)集學(xué)習(xí)的智能系統(tǒng)設(shè)計(jì)介紹。在課堂上，我開(kāi)發(fā)了用于圖像識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)、用于自然語(yǔ)言處理的嵌入式神經(jīng)網(wǎng)絡(luò)，以及使用循環(huán)神經(jīng)網(wǎng)絡(luò)／長(zhǎng)短期記憶網(wǎng)絡(luò)的字符級(jí)文本生成。你們可以在Jupiter Notebook適用代碼，所有代碼都能在這個(gè)GitHub 存儲(chǔ)庫(kù)中找到。

最近，我又開(kāi)始閱讀有關(guān)該深度學(xué)習(xí)的學(xué)術(shù)論文。根據(jù)我的研究，以下是一些對(duì)該領(lǐng)域的發(fā)展產(chǎn)生巨大影響的出版物：

? 紐約大學(xué) 基于梯度的學(xué)習(xí)應(yīng)用于文檔識(shí)別 （1998），它將卷積神經(jīng)網(wǎng)絡(luò)引入機(jī)器學(xué)習(xí)世界。

? 多倫多大學(xué)的 Deep Boltzmann Machines （2009），它為Boltzmann機(jī)器提供了一種新的學(xué)習(xí)算法，包含許多隱藏變量層。

? 斯坦福和谷歌 使用大規(guī)模無(wú)監(jiān)督學(xué)習(xí)構(gòu)建高級(jí)功能 （2012），解決了僅使用未標(biāo)記數(shù)據(jù)構(gòu)建高級(jí)，類特定功能檢測(cè)器的問(wèn)題。

? Berkeley的 DeCAF-一種用于通用視覺(jué)識(shí)別的深度卷積激活功能 （2013），它發(fā)布了DeCAF，這是 一種深度卷積激活功能 的開(kāi)源實(shí)現(xiàn)，以及所有相關(guān)的網(wǎng)絡(luò)參數(shù)，使視覺(jué)研究人員能夠進(jìn)行深度實(shí)驗(yàn)跨越一系列視覺(jué)概念學(xué)習(xí)范例的表示。

? DeepMind 使用Deep Reinforcement Learning （2016） 播放Atari ，它提供了第一個(gè)深度學(xué)習(xí)模型，可以使用強(qiáng)化學(xué)習(xí)直接從高維感覺(jué)輸入成功學(xué)習(xí)控制策略。

通過(guò)研究和學(xué)習(xí)論文，我學(xué)到了很多關(guān)于深度學(xué)習(xí)的豐富知識(shí)。在這里，我想分享AI工程師可以應(yīng)用于機(jī)器學(xué)習(xí)問(wèn)題的 10種強(qiáng)大的深度學(xué)習(xí)方法 。但首先，讓我們來(lái)定義深度學(xué)習(xí)是什么。深度學(xué)習(xí)對(duì)于許多人來(lái)說(shuō)是一個(gè)挑戰(zhàn)，因?yàn)樗男问皆谶^(guò)去十年中逐漸發(fā)生了改變。為了向各位更好的說(shuō)明深層學(xué)習(xí)的地位，下圖說(shuō)明了人工智能，機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間關(guān)系的概念。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

人工智能領(lǐng)域很廣泛，并且已經(jīng)存在了很長(zhǎng)時(shí)間。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)子集，而機(jī)器學(xué)習(xí)只是人工智能的一個(gè)子領(lǐng)域。將深度學(xué)習(xí)網(wǎng)絡(luò)與之前的前饋多層網(wǎng)絡(luò)進(jìn)行區(qū)分：

? 深度學(xué)習(xí)比以前的網(wǎng)絡(luò)更多的神經(jīng)元；

? 深度學(xué)習(xí)中有更復(fù)雜的連接層的方式；

? “寒武紀(jì)爆炸”的提供的計(jì)算能力；

? 深度學(xué)習(xí)可以自動(dòng)進(jìn)行特征提取。

當(dāng)我說(shuō)到“更多神經(jīng)元”時(shí)，是指近年來(lái)神經(jīng)元的數(shù)量不斷增加，深度學(xué)習(xí)就可以表示更為復(fù)雜的模型。層也從多層網(wǎng)絡(luò)中每一層的完全連接，進(jìn)化成卷積神經(jīng)網(wǎng)絡(luò)中神經(jīng)元片段的局部連接，以及與遞歸神經(jīng)網(wǎng)絡(luò)中的同一神經(jīng)元的循環(huán)連接（與前一層的連接除外）。

深度學(xué)習(xí)可以被定義為具有大量參數(shù)和層數(shù)的神經(jīng)網(wǎng)絡(luò)：

? 無(wú)人監(jiān)督的預(yù)訓(xùn)練網(wǎng)絡(luò)；

? 卷積神經(jīng)網(wǎng)絡(luò)；

? 循環(huán)神經(jīng)網(wǎng)絡(luò)；

? 遞歸神經(jīng)網(wǎng)絡(luò)。

在這篇文章中，我主要對(duì)后三種網(wǎng)絡(luò)進(jìn)行講解。

卷積神經(jīng)網(wǎng)絡(luò)（CNN） 基本上式已經(jīng)跨越使用共享權(quán)重的空間延伸的標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)。CNN旨在通過(guò)在內(nèi)部的卷積來(lái)識(shí)別圖像，該卷積看到圖像上識(shí)別對(duì)象的邊緣。

遞歸神經(jīng)網(wǎng)絡(luò)基本上是一個(gè)使用時(shí)間延伸擴(kuò)展空間的標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)，它提取進(jìn)入下一時(shí)間步的邊沿，而不是在同一時(shí)間進(jìn)入下一層。

RNN 進(jìn)行序列識(shí)別，例如語(yǔ)音或文本信號(hào)，因其內(nèi)部具有循環(huán)，意味著在RNN網(wǎng)絡(luò)中存在短時(shí)記憶。遞歸神經(jīng)網(wǎng)絡(luò)更類似于分層網(wǎng)絡(luò)，其中輸入序列實(shí)際上與時(shí)間無(wú)關(guān)，但輸入必須以樹狀方式分層處理。

下面的10種方法可以應(yīng)用于所有這些架構(gòu)。

1- 反向傳播

Back-prop 反向傳播只是一種簡(jiǎn)單計(jì)算函數(shù)的偏導(dǎo)數(shù)的方法，它具有函數(shù)組合的形式（如神經(jīng)網(wǎng)絡(luò)中）。當(dāng)你使用基于梯度的方法解決最優(yōu)化問(wèn)題（梯度下降只是其中之一）時(shí)，你希望在每次迭代時(shí)計(jì)算函數(shù)漸變，這個(gè)時(shí)候它便可以發(fā)揮作用。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

對(duì)于神經(jīng)網(wǎng)絡(luò)，其目標(biāo)函數(shù)具有組合的形式。你如何計(jì)算梯度？有兩種常見(jiàn)的方法可以做到：（i） 分析微分法 。如果你知道函數(shù)的形式，你只需使用鏈?zhǔn)揭?guī)則（基本微積分）計(jì)算導(dǎo)數(shù)。（ii） 有限差分的近似微分 。該方法在計(jì)算上是昂貴的，因?yàn)樵u(píng)估函數(shù)的數(shù)量是 O（N） ，其中 N 是參數(shù)的數(shù)量。與解析微分相比，這種方法的計(jì)算成本是昂貴的。在調(diào)試時(shí)，通常使用有限差分驗(yàn)證反向傳播的執(zhí)行效果。

2- 隨機(jī)梯度下降

想象梯度下降的直觀方式是想象一條源自山頂?shù)暮恿鞯穆窂?。梯度下降的目?biāo)正是河流努力實(shí)現(xiàn)的目標(biāo)，即從山頂流到最低點(diǎn)。

現(xiàn)在，如果山的地形形狀使得河流在到達(dá)其最終目的地之前不必完全停在任何地方，這是我們想要的理想情況。在機(jī)器學(xué)習(xí)中，這相當(dāng)于說(shuō)，我們已經(jīng)從初始點(diǎn)（山頂）開(kāi)始找到解決方案的全局最小值（或最優(yōu)值）。然而，可能由于地形性質(zhì)，導(dǎo)致河流路徑出現(xiàn)若干的坑洼，會(huì)迫使河流困住和停滯。在機(jī)器學(xué)習(xí)方面，這種坑洼被稱為局部最優(yōu)解，這是我們不想要的情況。當(dāng)然有很多方法可以解決局部最優(yōu)解問(wèn)題，這里我不打算進(jìn)一步討論。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

因此，梯度下降傾向于陷入局部最小值，這取決于地形的性質(zhì)（或ML術(shù)語(yǔ)中的函數(shù)）。但是，當(dāng)你有一種特殊的山地形狀（形狀像一個(gè)碗，用ML術(shù)語(yǔ)稱為凸函數(shù)）時(shí)，算法始終能夠找到最優(yōu)值。你可以想象將這條河流可視化。在機(jī)器學(xué)習(xí)中，這些特殊的地形（也稱為凸函數(shù)）總是需要優(yōu)化的。另外，你從山頂開(kāi)始（即函數(shù)的初始值）的位置不同，最終你到達(dá)山底的路徑也完全不同。同樣，根據(jù)河流的流淌速度（即梯度下降算法的學(xué)習(xí)速率或步長(zhǎng)），你可能會(huì)以不同的方式到達(dá)目的地。你是否會(huì)陷入或避免一個(gè)坑（局部最?。紩?huì)被這兩個(gè)標(biāo)準(zhǔn)影響。

3- 學(xué)習(xí)速率衰減

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

調(diào)整隨機(jī)梯度下降優(yōu)化程序的學(xué)習(xí)速率可以提高性能并縮短訓(xùn)練時(shí)間。有時(shí)這也被稱為學(xué)習(xí)率退火或自適應(yīng)學(xué)習(xí)率。在訓(xùn)練期間最簡(jiǎn)單且最常用的學(xué)習(xí)率調(diào)整是隨時(shí)間降低學(xué)習(xí)率的技術(shù)。在訓(xùn)練初期使用較大的學(xué)習(xí)速率值，可以對(duì)學(xué)習(xí)速率進(jìn)行大幅調(diào)整；在訓(xùn)練后期，降低學(xué)習(xí)速率，使模型以一個(gè)較小的速率進(jìn)行權(quán)重的更新。這種技術(shù)在早期可以快速學(xué)習(xí)獲得一些較好的權(quán)重，并在后期對(duì)權(quán)重進(jìn)行微調(diào)。

兩種流行且易于使用的學(xué)習(xí)率衰減如下：

? 在每個(gè)環(huán)節(jié)逐漸降低學(xué)習(xí)率。

? 在特定時(shí)期使用大幅下降來(lái)降低學(xué)習(xí)速率。

4-Dropout

具有大量參數(shù)的深度神經(jīng)網(wǎng)絡(luò)是非常強(qiáng)大的機(jī)器學(xué)習(xí)系統(tǒng)。然而，過(guò)度擬合是這種網(wǎng)絡(luò)中的嚴(yán)重問(wèn)題。大型網(wǎng)絡(luò)使用起來(lái)也很慢，因此在測(cè)試時(shí)將許多不同的大型神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)合起來(lái)很難處理過(guò)度擬合。Dropout就是一種解決此問(wèn)題的技術(shù)。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

關(guān)鍵思想是在訓(xùn)練期間從神經(jīng)網(wǎng)絡(luò)中隨機(jī)刪除單元及其連接，這可以防止單元間的過(guò)度適應(yīng)。在訓(xùn)練期間，從指數(shù)數(shù)量的不同“稀疏”網(wǎng)絡(luò)中抽取樣本。在測(cè)試時(shí)，通過(guò)簡(jiǎn)單地使用具有較小權(quán)重的單解開(kāi)網(wǎng)絡(luò)（untwinednetwork），很容易近似平均所有這些稀疏網(wǎng)絡(luò)以達(dá)到預(yù)測(cè)的效果。這顯著減少了過(guò)度擬合，并且比其他正則化方法表現(xiàn)的更好。

Dropout 已被證明可以改善神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)，語(yǔ)音識(shí)別，文檔分類和計(jì)算生物學(xué)等領(lǐng)域的監(jiān)督學(xué)習(xí)任務(wù)的性能，并在許多基準(zhǔn)數(shù)據(jù)集上獲得最先進(jìn)的結(jié)果。

5- 最大池化

最大池化是基于樣本的離散化過(guò)程。目的是對(duì)輸入表示（圖像、隱藏層輸出矩陣等）進(jìn)行下采樣，通過(guò)降低其維數(shù)并允許對(duì)包含在子區(qū)域中的特征進(jìn)行合并。

通過(guò)提供表征的抽象形式，這種方法在某種程度上有助于解決過(guò)擬合。同樣，它也通過(guò)減少學(xué)習(xí)參數(shù)的數(shù)量和提供基本的內(nèi)部表征的轉(zhuǎn)換不變性來(lái)減少計(jì)算量。最大池化是通過(guò)將最大過(guò)濾器應(yīng)用于通常不重疊的初始表征子區(qū)域來(lái)完成的。

6- 批量歸一化

當(dāng)然，包括深度網(wǎng)絡(luò)在內(nèi)的神經(jīng)網(wǎng)絡(luò)需要仔細(xì)調(diào)整權(quán)重初始化和學(xué)習(xí)參數(shù)。批量歸一化有助于讓中國(guó)過(guò)程更簡(jiǎn)單一點(diǎn)。

權(quán)重問(wèn)題：

· 無(wú)論那種權(quán)重的初始化，隨機(jī)還是憑經(jīng)驗(yàn)選擇，它們都和學(xué)習(xí)權(quán)重差別很大?？紤]一個(gè)小批量數(shù)據(jù)集，在最初的時(shí)期，在特征激活時(shí)都會(huì)有許多異常值。

· 深度神經(jīng)網(wǎng)絡(luò)本身脆弱的，即初始層的微小擾動(dòng)都會(huì)導(dǎo)致后面層很大的變化。

在反向傳播期間，這些現(xiàn)象會(huì)導(dǎo)致梯度偏移，這意味著在學(xué)習(xí)權(quán)重以產(chǎn)生所需輸出之前，梯度必須補(bǔ)償異常值。這也將導(dǎo)致需要額外的時(shí)間來(lái)收斂。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

批量歸一化將這些梯度從離散規(guī)則化為正常值，并在小批量的范圍內(nèi)朝向共同目標(biāo)（通過(guò)歸一化它們）流動(dòng)。

學(xué)習(xí)率問(wèn)題： 通常，學(xué)習(xí)率保持較小，使得只有一小部分的梯度用來(lái)校正權(quán)重，原因是異常激活的梯度不應(yīng)該影響已經(jīng)學(xué)習(xí)好的權(quán)重。通過(guò)批量歸一化，這些異常值被激活的可能性就會(huì)減少，因此可以使用更高的學(xué)習(xí)率來(lái)加速學(xué)習(xí)過(guò)程。

7- 長(zhǎng)短期記憶：

LSTM 網(wǎng)絡(luò)具有以下三個(gè)方面，使其與遞歸神經(jīng)網(wǎng)絡(luò)中的常規(guī)神經(jīng)元區(qū)分開(kāi)來(lái)：

1 、它可以控制何時(shí)讓輸入進(jìn)入神經(jīng)元。

2 、它可以控制何時(shí)記住上一個(gè)時(shí)間步驟中計(jì)算的內(nèi)容。

3 、它可以控制何時(shí)將輸出傳遞給下一個(gè)時(shí)間戳。

LSTM 的優(yōu)點(diǎn)在于它根據(jù)當(dāng)前輸入本身決定所有這些，如下圖所示：

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

當(dāng)前時(shí)間戳處的輸入信號(hào)x（t）決定所有上述3個(gè)點(diǎn)。輸入門決定點(diǎn)1.遺忘門在點(diǎn)2上做出決定，輸出門在點(diǎn)3上做出決定。輸入門能單獨(dú)能夠做出這三個(gè)決定。這受到了我們的大腦是如何工作的啟發(fā)，并且可以處理突然的上下文切換。

8-Skip-gram ：

詞嵌入模型的目標(biāo)是為了每個(gè)詞匯學(xué)習(xí)一個(gè)高維密集表征，其中嵌入向量之間的相似性顯示了相應(yīng)單詞之間的語(yǔ)義或句法相似性。Skip-gram是學(xué)習(xí)詞嵌入算法的模型。

skip-gram 模型（以及許多其他詞嵌入模型）背后的主要思想如下：如果兩個(gè)詞匯有相似的上下文，則它們是相似的。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

換句話說(shuō)，假設(shè)你有一句話，比如“貓是哺乳動(dòng)物”。如果你使用術(shù)語(yǔ)“狗”而不是“貓”，句子仍然是一個(gè)有意義的句子。因此在該示例中，“狗”和“貓”可以共享相同的背景（即“是哺乳動(dòng)物”）。

基于上述假設(shè)，你可以考慮一個(gè)上下文窗口（一個(gè)包含k個(gè)連續(xù)術(shù)語(yǔ)的窗口）。然后你應(yīng)該跳過(guò)其中一個(gè)單詞，并嘗試學(xué)習(xí)除了跳過(guò)的一個(gè)術(shù)語(yǔ)之外的所有術(shù)語(yǔ)并預(yù)測(cè)跳過(guò)的術(shù)語(yǔ)的神經(jīng)網(wǎng)絡(luò)。因此如果兩個(gè)單詞在大型語(yǔ)料庫(kù)中重復(fù)地共享相似的上下文，那些這些術(shù)語(yǔ)的嵌入向量將具有相似的向量。

9- 連續(xù)的詞袋模型（Continuous Bag of Words）：

在自然語(yǔ)言處理問(wèn)題中，我們希望學(xué)習(xí)將文檔中的每個(gè)單詞表示為數(shù)字向量，使得出現(xiàn)在相似上下文中的單詞具有彼此接近的向量。在連續(xù)詞袋模型中，目標(biāo)是能夠使用圍繞特定單詞的上下文并預(yù)測(cè)特定單詞。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

我們通過(guò)在一個(gè)大型語(yǔ)料庫(kù)中抽取大量句子來(lái)做到這一點(diǎn)，每次看到一個(gè)單詞時(shí)，我們都會(huì)使用其上下文單詞。然后我們將上下文單詞輸入到一個(gè)神經(jīng)網(wǎng)絡(luò)中，并預(yù)測(cè)該上下文中心的單詞。

當(dāng)我們有數(shù)千個(gè)這樣的上下文單詞和中心單詞時(shí)，我們就有一個(gè)神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)集的實(shí)例。我們訓(xùn)練神經(jīng)網(wǎng)絡(luò)，在經(jīng)過(guò)編碼的隱藏層的輸出表示特定單詞的嵌入。碰巧的是，當(dāng)我們?cè)诖罅烤渥由嫌?xùn)練時(shí)，類似上下文中的單詞會(huì)得到類似的向量。

10- 遷移學(xué)習(xí)：

考慮下圖像是如何通過(guò)卷積神經(jīng)網(wǎng)絡(luò)的。假設(shè)你有一個(gè)圖像，你應(yīng)用卷積，你得到像素組合作為輸出。如果碰到了邊緣，則再次應(yīng)用卷積，所以現(xiàn)在輸出是邊或線的組合。然后再次應(yīng)用卷積，此時(shí)的輸出將是線的組合，依此類推。你可以將其視為每個(gè)層尋找特定模式。神經(jīng)網(wǎng)絡(luò)的最后一層往往變得非常專業(yè)。如果你正在使用ImageNet，那么你的網(wǎng)絡(luò)最后一層將尋找兒童或狗或飛機(jī)或其他什么。再后退幾層你可能會(huì)看到網(wǎng)絡(luò)正在尋找眼睛或耳朵或嘴或輪子。

AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法

深度CNN中的每個(gè)層逐漸建立了更高和更高級(jí)別的特征表征。最后幾層往往專注于你輸入模型的任何數(shù)據(jù)。另一方面，早期的圖層更通用，是在更大類的圖片中找到很多簡(jiǎn)單的模式。

遷移學(xué)習(xí)是指你在一個(gè)數(shù)據(jù)集上訓(xùn)練CNN，切斷最后一層，在其他不同的數(shù)據(jù)集上重新訓(xùn)練模型的最后一層。直觀地說(shuō)，你正在重新訓(xùn)練模型以識(shí)別不同的更高級(jí)別的功能。因此，模型訓(xùn)練的時(shí)間會(huì)大大減少，因此當(dāng)你沒(méi)有足夠的數(shù)據(jù)或者訓(xùn)練所需的太多資源時(shí)，遷移學(xué)習(xí)是一種有用的工具。

本文僅顯示這些方法的一般概述。我建議閱讀以下文章以獲得更詳細(xì)的解釋：

· Andrew Beam的 “深度學(xué)習(xí)101” ；

· 安德烈?guī)炝挚品虻? “神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)簡(jiǎn)史” ；

· Adit Deshpande的 “理解卷積神經(jīng)網(wǎng)絡(luò)的初學(xué)者指南” ；

· 克里斯奧拉的 “理解LSTM 網(wǎng)絡(luò)” ；

· Algobean的 “人工神經(jīng)網(wǎng)絡(luò)” ；

· Andrej Karpathy的 “ 回歸 神經(jīng)網(wǎng)絡(luò)的不合理有效性” ；

深度學(xué)習(xí)是非常注重技術(shù)實(shí)踐的。本文中的每個(gè)新想法都沒(méi)有太多具體的解釋。對(duì)于大多數(shù)新想法都附帶了實(shí)驗(yàn)結(jié)果來(lái)證明它們能夠運(yùn)作。深度學(xué)習(xí)就像玩樂(lè)高，掌握樂(lè)高與任何其他藝術(shù)一樣具有挑戰(zhàn)性，但相比之下入門樂(lè)高是容易的。

轉(zhuǎn)自： https://www.cnblogs.com/DicksonJYL/p/9591732.html

網(wǎng)站題目：AI從業(yè)者需要應(yīng)用的10種深度學(xué)習(xí)方法
轉(zhuǎn)載源于：http://muchs.cn/article30/pgosso.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站改版、小程序開(kāi)發(fā)、定制網(wǎng)站、網(wǎng)站建設(shè)、域名注冊(cè)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容