大數(shù)據(jù)分析中最重要的32個(gè)算法

2021-03-09 分類(lèi)：網(wǎng)站建設(shè)

奧地利符號(hào)計(jì)算研究所的Christoph Koutschan博士在自己的頁(yè)面上發(fā)布了一篇文章，提到他做了一個(gè)調(diào)查，參與者大多數(shù)是計(jì)算機(jī)科學(xué)家，他請(qǐng)這些科學(xué)家投票選出最重要的算法，以下是這次調(diào)查的結(jié)果，按照英文名稱(chēng)字母順序排序。

1、A* 搜索算法

—圖形搜索算法，從給定起點(diǎn)到給定終點(diǎn)計(jì)算出路徑。其中使用了一種啟發(fā)式的估算，為每個(gè)節(jié)點(diǎn)估算通過(guò)該節(jié)點(diǎn)的好路徑，并以之為各個(gè)地點(diǎn)排定次序。算法以得到的次序訪問(wèn)這些節(jié)點(diǎn)。因此，A*搜索算法是好優(yōu)先搜索的范例。

2、集束搜索(又名定向搜索，Beam Search)——好優(yōu)先搜索算法的優(yōu)化。使用啟發(fā)式函數(shù)評(píng)估它檢查的每個(gè)節(jié)點(diǎn)的能力。不過(guò)，集束搜索只能在每個(gè)深度中發(fā)現(xiàn)最前面的m個(gè)最符合條件的節(jié)點(diǎn)，m是固定數(shù)字——集束的寬度。

3、二分查找(Binary Search)——在線性數(shù)組中找特定值的算法，每個(gè)步驟去掉一半不符合要求的數(shù)據(jù)。

4、分支界定算法(Branch and Bound)——在多種最優(yōu)化問(wèn)題中尋找特定最優(yōu)化解決方案的算法，特別是針對(duì)離散、組合的最優(yōu)化。

5、Buchberger算法——一種數(shù)學(xué)算法，可將其視為針對(duì)單變量大公約數(shù)求解的歐幾里得算法和線性系統(tǒng)中高斯消元法的泛化。

6、數(shù)據(jù)壓縮——采取特定編碼方案，使用更少的字節(jié)數(shù)(或是其他信息承載單元)對(duì)信息編碼的過(guò)程，又叫來(lái)源編碼。

7、Diffie-Hellman密鑰交換算法——一種加密協(xié)議，允許雙方在事先不了解對(duì)方的情況下，在不安全的通信信道中，共同建立共享密鑰。該密鑰以后可與一個(gè)對(duì)稱(chēng)密碼一起，加密后續(xù)通訊。

8、Dijkstra算法——針對(duì)沒(méi)有負(fù)值權(quán)重邊的有向圖，計(jì)算其中的單一起點(diǎn)最短算法。

9、離散微分算法(Discrete differentiation)。

10、動(dòng)態(tài)規(guī)劃算法(Dynamic Programming)——展示互相覆蓋的子問(wèn)題和最優(yōu)子架構(gòu)算法

11、歐幾里得算法(Euclidean algorithm)——計(jì)算兩個(gè)整數(shù)的大公約數(shù)。最古老的算法之一，出現(xiàn)在公元前300前歐幾里得的《幾何原本》。

12、期望-大算法(Expectation-maximization algorithm，又名EM-Training)——在統(tǒng)計(jì)計(jì)算中，期望-大算法在概率模型中尋找可能性大的參數(shù)估算值，其中模型依賴(lài)于未發(fā)現(xiàn)的潛在變量。EM在兩個(gè)步驟中交替計(jì)算，第一步是計(jì)算期望，利用對(duì)隱藏變量的現(xiàn)有估計(jì)值，計(jì)算其大可能估計(jì)值;第二步是大化，大化在第一步上求得的大可能值來(lái)計(jì)算參數(shù)的值。

13、快速傅里葉變換(Fast Fourier transform，F(xiàn)FT)——計(jì)算離散的傅里葉變換(DFT)及其反轉(zhuǎn)。該算法應(yīng)用范圍很廣，從數(shù)字信號(hào)處理到解決偏微分方程，到快速計(jì)算大整數(shù)乘積。

14、梯度下降(Gradient descent)——一種數(shù)學(xué)上的最優(yōu)化算法。

15、哈希算法(Hashing)。

16、堆排序(Heaps)。

17、Karatsuba乘法——需要完成上千位整數(shù)的乘法的系統(tǒng)中使用，比如計(jì)算機(jī)代數(shù)系統(tǒng)和大數(shù)程序庫(kù)，如果使用長(zhǎng)乘法，速度太慢。該算法發(fā)現(xiàn)于1962年。

18、LLL算法(Lenstra-Lenstra-Lovasz lattice reduction)——以格規(guī)約(lattice)基數(shù)為輸入，輸出短正交向量基數(shù)。LLL算法在以下公共密鑰加密方法中有大量使用：背包加密系統(tǒng)(knapsack)、有特定設(shè)置的RSA加密等等。

19、大流量算法(Maximum flow)——該算法試圖從一個(gè)流量網(wǎng)絡(luò)中找到大的流。它優(yōu)勢(shì)被定義為找到這樣一個(gè)流的值。大流問(wèn)題可以看作更復(fù)雜的網(wǎng)絡(luò)流問(wèn)題的特定情況。大流與網(wǎng)絡(luò)中的界面有關(guān)，這就是大流-最小截定理(Max-flow min-cut theorem)。Ford-Fulkerson 能找到一個(gè)流網(wǎng)絡(luò)中的大流。

20、合并排序(Merge Sort)。

21、牛頓法(Newton’s method)——求非線性方程(組)零點(diǎn)的一種重要的迭代法。

22、Q-learning學(xué)習(xí)算法——這是一種通過(guò)學(xué)習(xí)動(dòng)作值函數(shù)(action-value function)完成的強(qiáng)化學(xué)習(xí)算法，函數(shù)采取在給定狀態(tài)的給定動(dòng)作，并計(jì)算出期望的效用價(jià)值，在此后遵循固定的策略。Q-leanring的優(yōu)勢(shì)是，在不需要環(huán)境模型的情況下，可以對(duì)比可采納行動(dòng)的期望效用。

23、兩次篩法(Quadratic Sieve)——現(xiàn)代整數(shù)因子分解算法，在實(shí)踐中，是目前已知第二快的此類(lèi)算法(僅次于數(shù)域篩法Number Field Sieve)。對(duì)于110位以下的十位整數(shù)，它仍是最快的，而且都認(rèn)為它比數(shù)域篩法更簡(jiǎn)單。

24、RANSAC——是“RANdom SAmple Consensus”的縮寫(xiě)。該算法根據(jù)一系列觀察得到的數(shù)據(jù)，數(shù)據(jù)中包含異常值，估算一個(gè)數(shù)學(xué)模型的參數(shù)值。其基本假設(shè)是：數(shù)據(jù)包含非異化值，也就是能夠通過(guò)某些模型參數(shù)解釋的值，異化值就是那些不符合模型的數(shù)據(jù)點(diǎn)。

25、RSA——公鑰加密算法。首個(gè)適用于以簽名作為加密的算法。RSA在電商行業(yè)中仍大規(guī)模使用，大家也相信它有足夠安全長(zhǎng)度的公鑰。

26、Sch?nhage-Strassen算法——在數(shù)學(xué)中，Sch?nhage-Strassen算法是用來(lái)完成大整數(shù)的乘法的快速漸近算法。其算法復(fù)雜度為：O(N log(N) log(log(N)))，該算法使用了傅里葉變換。

27、單純型算法(Simplex Algorithm)——在數(shù)學(xué)的優(yōu)化理論中，單純型算法是常用的技術(shù)，用來(lái)找到線性規(guī)劃問(wèn)題的數(shù)值解。線性規(guī)劃問(wèn)題包括在一組實(shí)變量上的一系列線性不等式組，以及一個(gè)等待大化(或最小化)的固定線性函數(shù)。

28、奇異值分解(Singular value decomposition，簡(jiǎn)稱(chēng)SVD)——在線性代數(shù)中，SVD是重要的實(shí)數(shù)或復(fù)數(shù)矩陣的分解方法，在信號(hào)處理和統(tǒng)計(jì)中有多種應(yīng)用，比如計(jì)算矩陣的偽逆矩陣(以求解最小二乘法問(wèn)題)、解決超定線性系統(tǒng)(overdetermined linear systems)、矩陣逼近、數(shù)值天氣預(yù)報(bào)等等。

29、求解線性方程組(Solving a system of linear equations)——線性方程組是數(shù)學(xué)中最古老的問(wèn)題，它們有很多應(yīng)用，比如在數(shù)字信號(hào)處理、線性規(guī)劃中的估算和預(yù)測(cè)、數(shù)值分析中的非線性問(wèn)題逼近等等。求解線性方程組，可以使用高斯—約當(dāng)消去法(Gauss-Jordan elimination)，或是柯列斯基分解( Cholesky decomposition)。

30、Strukturtensor算法——應(yīng)用于模式識(shí)別領(lǐng)域，為所有像素找出一種計(jì)算方法，看看該像素是否處于同質(zhì)區(qū)域( homogenous region)，看看它是否屬于邊緣，還是是一個(gè)頂點(diǎn)。

31、合并查找算法(Union-find)——給定一組元素，該算法常常用來(lái)把這些元素分為多個(gè)分離的、彼此不重合的組。不相交集(disjoint-set)的數(shù)據(jù)結(jié)構(gòu)可以跟蹤這樣的切分方法。合并查找算法可以在此種數(shù)據(jù)結(jié)構(gòu)上完成兩個(gè)有用的操作：

查找：判斷某特定元素屬于哪個(gè)組。

合并：聯(lián)合或合并兩個(gè)組為一個(gè)組。

32、維特比算法(Viterbi algorithm)——尋找隱藏狀態(tài)最有可能序列的動(dòng)態(tài)規(guī)劃算法，這種序列被稱(chēng)為維特比路徑，其結(jié)果是一系列可以觀察到的事件，特別是在隱藏的Markov模型中。

以上就是Christoph博士對(duì)于最重要的算法的調(diào)查結(jié)果。你們熟悉哪些算法?又有哪些算法是你們經(jīng)常使用的?

網(wǎng)站名稱(chēng)：大數(shù)據(jù)分析中最重要的32個(gè)算法
本文網(wǎng)址：http://www.muchs.cn/news10/104860.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供微信小程序、網(wǎng)站營(yíng)銷(xiāo)、手機(jī)網(wǎng)站建設(shè)、域名注冊(cè)、做網(wǎng)站、響應(yīng)式網(wǎng)站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

“域名——網(wǎng)站——空間”建站知識(shí)簡(jiǎn)要概述 2021-03-09
Docker是什么？和虛擬機(jī)有什么關(guān)系？ 2021-03-09
服務(wù)器租用的好處 2021-03-09
互聯(lián)網(wǎng)思維已經(jīng)是過(guò)去式，下一步是：AI思維 2021-03-09
八個(gè)域名防盜小技巧 2021-03-09
淺析網(wǎng)站打不開(kāi)的幾種可能性因素 2021-03-09