人工智能加持，已經(jīng)擋不住科學(xué)的步伐了

2021-02-16 分類：網(wǎng)站建設(shè)

最新的AI算法正在探測星系的演化、計(jì)算量子波函數(shù)、發(fā)現(xiàn)新的化合物等等。還有什么是事情是科學(xué)家不能自動(dòng)化的呢？

沒有人類或一個(gè)團(tuán)隊(duì)能夠完全跟上當(dāng)今許多物理學(xué)和天文學(xué)實(shí)驗(yàn)所產(chǎn)生的海量信息。他們中的一些人每天都要記錄TB的數(shù)據(jù)，而且洪流只會(huì)越來越大。 Square Kilometer Array是一臺(tái)預(yù)定在20世紀(jì)20年代中期開啟的射電望遠(yuǎn)鏡，每年將產(chǎn)生與整個(gè)互聯(lián)網(wǎng)一樣多的數(shù)據(jù)流量。

“洪流”讓許多科學(xué)家轉(zhuǎn)向人工智能尋求幫助。人工神經(jīng)網(wǎng)絡(luò)（人工神經(jīng)網(wǎng)絡(luò) - 模擬大腦功能的神經(jīng)元的計(jì)算機(jī)模擬網(wǎng)絡(luò)）等人工智能系統(tǒng)可以通過最少的人工輸入，就能處理海量數(shù)據(jù)，突出異常并檢測人類永遠(yuǎn)無法發(fā)現(xiàn)的模式。

當(dāng)然，使用計(jì)算機(jī)來輔助科學(xué)研究大約可以追溯到75年前，而通過手工研究數(shù)據(jù)以尋找有意義的模式的方法起源于數(shù)千年前。但是一些科學(xué)家認(rèn)為，機(jī)器學(xué)習(xí)和人工智能的最新技術(shù)代表了一種全新的科學(xué)方法。其中一種方法，即生成建模，可以幫助在對(duì)觀測數(shù)據(jù)的各種相互矛盾的解釋中找出最可信的理論，這種理論只基于數(shù)據(jù)，并且重要的是，沒有任何預(yù)編程的知識(shí)，可以在所研究的系統(tǒng)中起作用的物理過程。生成模型的支持者認(rèn)為它足夠新穎，可以被認(rèn)為是了解宇宙的潛在“第三條道路”。

現(xiàn)在讓我們從腦海中抹去關(guān)于天體物理學(xué)的一切知識(shí)。我們在多大程度上可以只使用數(shù)據(jù)本身重新發(fā)現(xiàn)這些知識(shí)？ Kevin Schawinski

傳統(tǒng)上，我們通過觀察了解了自然。可以仔細(xì)研究下約翰內(nèi)斯·開普勒（Johannes Kepler）在第谷布拉赫（Tycho Brahe）的行星位置表，并試圖辨別出潛在的模式。（他最終推斷出行星在橢圓軌道上運(yùn)動(dòng)。）科學(xué)也通過模擬推進(jìn)。一位天文學(xué)家可能會(huì)模擬銀河系及其鄰近星系仙女座星系的運(yùn)動(dòng)，并預(yù)測它們將在數(shù)十億年后發(fā)生碰撞。觀察和模擬都有助于科學(xué)家產(chǎn)生假設(shè)，然后可以通過進(jìn)一步的觀察進(jìn)行測試，生成的建模不同于這兩種方法。

“它基本上是觀察和模擬之間的第三種方法，”天文物理學(xué)家和生成模型最熱情的支持者之一Kevin Schawinski表示， “這是解決問題的另一種方式?！?/p>

一些科學(xué)家將生成建模和其他新技術(shù)視為傳統(tǒng)科學(xué)的動(dòng)力工具。但大多數(shù)人都認(rèn)為人工智能正在產(chǎn)生巨大影響，而且它在科學(xué)中的作用只會(huì)增長。 Fermi國家加速器實(shí)驗(yàn)室的天體物理學(xué)家Brian Nord使用人工神經(jīng)網(wǎng)絡(luò)來研究宇宙，他們擔(dān)心“人類科學(xué)家沒有什么是不可以實(shí)現(xiàn)自動(dòng)化的”這種論斷。

一代人的發(fā)現(xiàn)

自研究生畢業(yè)以來，Schawinski一直以數(shù)據(jù)驅(qū)動(dòng)的科學(xué)為名。在攻讀博士學(xué)位期間，他面臨著根據(jù)外觀對(duì)數(shù)千個(gè)星系進(jìn)行分類的任務(wù)。因?yàn)檫@份工作沒有現(xiàn)成的軟件，所以他決定將其進(jìn)行眾包，因此銀河動(dòng)物園公民科學(xué)項(xiàng)目誕生了。從2007年開始，普通計(jì)算機(jī)用戶通過記錄他們對(duì)哪個(gè)星系屬于哪個(gè)類別的好猜測來幫助天文學(xué)家，多數(shù)規(guī)則通常導(dǎo)致正確的分類。該項(xiàng)目取得了成功，但是，正如Schawinski指出的那樣，人工智能已經(jīng)讓它變得過時(shí)了：“如今，具備機(jī)器學(xué)習(xí)和云計(jì)算訪問背景的才華橫溢的科學(xué)家可以在一個(gè)下午就完成整個(gè)工作?！?/p>

Schawinski在2016年轉(zhuǎn)向了生成建模的強(qiáng)大新工具。從本質(zhì)上講，生成建模會(huì)詢問在給定條件X的情況下，你會(huì)觀察到結(jié)果Y的可能性有多大。這種方法已被證明是非常有效的。例如，假設(shè)您為生成模型提供一組人臉圖像，每張臉都標(biāo)有人的年齡。當(dāng)計(jì)算機(jī)程序梳理這些“訓(xùn)練數(shù)據(jù)”時(shí)，它開始在較舊的面部之間建立聯(lián)系并增加皺紋的可能性。最終，它可以“老化”它所給予的任何面孔，也就是說，它可以預(yù)測任何年齡的特定面部可能經(jīng)歷的物理變化。

這些面孔都不是真實(shí)的。頂行（A）和左列（B）中的面是由生成對(duì)抗網(wǎng)絡(luò)（GAN）使用真實(shí)面部的構(gòu)建塊元素構(gòu)建的。然后，GAN將A中面部的基本特征（包括其性別、年齡和面部形狀）與B中面部的更精細(xì)特征（例如頭發(fā)顏色和眼睛顏色）相結(jié)合，以在網(wǎng)格的其余部分中創(chuàng)建所有面部。

最著名的生成建模系統(tǒng)是“生成對(duì)抗網(wǎng)絡(luò)”（GAN）。在充分暴露于訓(xùn)練數(shù)據(jù)之后，GAN可以修復(fù)已經(jīng)損壞或丟失像素的圖像，或者它們可以使模糊的照片清晰。他們學(xué)會(huì)通過競爭來推斷缺失的信息（因此稱為“對(duì)抗性”）：網(wǎng)絡(luò)的一部分，稱為生成器，生成假數(shù)據(jù)，而第二部分，即鑒別器，試圖區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。隨著程序的運(yùn)行，兩部分都會(huì)越來越好。你可能已經(jīng)看到了最近流傳的一些超現(xiàn)實(shí)主義的，GAN制作的“面孔”，正如一個(gè)標(biāo)題所說的那樣，“極其真實(shí)但是實(shí)際上并不存在”的形象。

更廣泛地說，生成建模采用數(shù)據(jù)集（通常是圖像，但并非總是如此），并將每個(gè)數(shù)據(jù)分解為一組基本的抽象構(gòu)建塊 - 科學(xué)家將其稱為數(shù)據(jù)的“潛在空間”。該算法操縱潛在空間的元素，看看它如何影響原始數(shù)據(jù)，這有助于發(fā)現(xiàn)系統(tǒng)中正在運(yùn)行的物理過程。

潛在空間的概念是抽象的，難以想象，但作為一個(gè)粗略的類比，想想當(dāng)你試圖確定人臉的性別時(shí)你的大腦可能在做什么。也許你會(huì)注意到發(fā)型、鼻子形狀等，以及你不能輕易用語言表達(dá)的圖案。計(jì)算機(jī)程序同樣在尋找數(shù)據(jù)中的顯著特征：雖然它不知道小胡子是什么或性別是什么，但是如果它是在數(shù)據(jù)集上訓(xùn)練的，其中一些圖像被標(biāo)記為“男人”或“女人”，并且其中有些人有一個(gè)“小胡子”標(biāo)簽，它會(huì)很快推斷出一個(gè)連接。

在12月發(fā)表于《天文學(xué)與天體物理學(xué)》(Astronomy & Astrophysics)雜志上的一篇論文中，Schawinski和他的蘇黎世聯(lián)邦理工學(xué)院的同事Dennis Turp和Ce Zhang使用生成模型來研究星系在演化過程中所經(jīng)歷的物理變化。（他們使用的軟件對(duì)待潛在空間與生成對(duì)抗網(wǎng)絡(luò)對(duì)待它的方式有所不同，因此技術(shù)上并不是GAN，盡管類似。）他們的模型創(chuàng)建了人工數(shù)據(jù)集，作為測試物理過程假設(shè)的一種方式。例如，他們詢問恒星形成的“淬火” - 形成速率的急劇下降 - 與星系環(huán)境密度的增加有什么關(guān)系。

對(duì)于Schawinski來說，關(guān)鍵問題是有多少關(guān)于恒星和星系過程的信息可以單獨(dú)從數(shù)據(jù)中挑出來。 “讓我們抹去我們所知道的關(guān)于天體物理學(xué)的一切，”他說。 “我們可以在多大程度上重新發(fā)現(xiàn)這些知識(shí)，只使用數(shù)據(jù)本身？”

首先，銀河系的圖像被縮小到它們的潛伏空間；然后，Schawinski可以調(diào)整該空間的一個(gè)元素，其方式與星系環(huán)境中的特定變化相對(duì)應(yīng) - 例如，周圍環(huán)境的密度。然后他可以重新生成銀河系，看看出現(xiàn)了什么差異。 “所以現(xiàn)在我有一臺(tái)假設(shè)生成機(jī)器，”他解釋道， “我可以拍攝一大堆最初處于低密度環(huán)境中的星系，并通過這個(gè)過程使它們看起來像是在高密度環(huán)境中?！盨chawinski、Turp和Zhang發(fā)現(xiàn)，當(dāng)星系從低密度到高密度的環(huán)境轉(zhuǎn)變，它們的顏色變得更紅，并且它們的恒星變得更加集中。 Schawinski認(rèn)為，這符合現(xiàn)有的關(guān)于星系的觀測結(jié)果。問題是為什么會(huì)這樣。

Schawinski說，下一步還沒有實(shí)現(xiàn)自動(dòng)化：“我必須以一個(gè)人類的身份進(jìn)入，然后說，'好吧，什么樣的物理學(xué)可以解釋這種效應(yīng)？”對(duì)于這個(gè)過程，有兩個(gè)看似合理的解釋：也許星系在高密度環(huán)境中變得更紅，因?yàn)樗鼈兒懈嗟膲m埃，或者由于恒星形成的減少而變得更紅（換句話說，它們的恒星往往更老）。通過生成模型，兩種想法都可以進(jìn)行測試：潛在空間中與塵埃和恒星形成率相關(guān)的元素被改變，以了解它如何影響星系的顏色。 “答案很明確，更紅的星系是恒星形成的地方，而不是塵埃變化的星系。所以我們應(yīng)該贊成這個(gè)解釋?！?/p>

使用生成模型，天體物理學(xué)家可以研究星系從宇宙的低密度區(qū)域到高密度區(qū)域時(shí)的變化，以及這些變化導(dǎo)致的物理過程。

該方法與傳統(tǒng)模擬有關(guān)，但存在重大差異。 Schawinski表示，模擬“基本上是假設(shè)驅(qū)動(dòng)的”。 “這種方法的意思是，'我想我知道導(dǎo)致我在系統(tǒng)中看到的所有東西的潛在物理定律是什么。'所以我有一個(gè)關(guān)于恒星形成的配方，我有暗物質(zhì)行為的配方，等等。我把所有的假設(shè)放在那里，然后讓模擬運(yùn)行起來。然后我問：這看起來像現(xiàn)實(shí)嗎？“他說，他在生成建模方面所做的是”在某種意義上，與模擬完全相反。我們什么都不知道;我們不想假設(shè)任何事情。我們希望數(shù)據(jù)本身告訴我們可能會(huì)發(fā)生什么。”

在這樣的研究中，成功建模顯然并不意味著天文學(xué)家和研究生已經(jīng)成為冗余，但它似乎代表了可以通過人工實(shí)現(xiàn)對(duì)天體物理學(xué)對(duì)象和過程的學(xué)習(xí)程度轉(zhuǎn)變。系統(tǒng)在電子指尖上的功能遠(yuǎn)遠(yuǎn)超過龐大的數(shù)據(jù)庫。 “這不是完全自動(dòng)化的科學(xué)，但它表明我們能夠至少部分地構(gòu)建使科學(xué)過程自動(dòng)化的工具?！?/p>

生成建模顯然是強(qiáng)大的，但它是否真正代表了一種新的科學(xué)方法，這一問題值得商榷。對(duì)于紐約大學(xué)和Flatiron研究所（與Quanta一樣，由Simons基金會(huì)資助）的宇宙學(xué)家David Hogg來說，這項(xiàng)技術(shù)令人印象深刻，但最終只是一種從數(shù)據(jù)中提取模式的非常復(fù)雜的方法，這也是天文學(xué)家所擁有的幾個(gè)世紀(jì)以來一直在做的事情。換句話說，它是一種先進(jìn)的觀察和分析形式。 Hogg自己的工作，如Schawinski的工作一樣，嚴(yán)重依賴AI；他一直在使用神經(jīng)網(wǎng)絡(luò)根據(jù)恒星的光譜對(duì)其進(jìn)行分類，并使用數(shù)據(jù)驅(qū)動(dòng)模型推斷恒星的其他物理屬性。但他認(rèn)為他的作品以及Schawinski的作品都是久經(jīng)考驗(yàn)的科學(xué)。 “我不認(rèn)為這是第三種方式，我只是認(rèn)為我們作為一個(gè)社區(qū)正在變得越來越復(fù)雜，我們?nèi)绾问褂眠@些數(shù)據(jù)。特別是，越來越好。但在我看來，我的工作仍完全處于觀察模式中?！?/p>

勤奮的助手

無論它們在概念上是否具有新穎性，很明顯AI和神經(jīng)網(wǎng)絡(luò)已經(jīng)在當(dāng)代天文學(xué)和物理學(xué)研究中發(fā)揮了關(guān)鍵作用。在海德堡理論研究所，物理學(xué)家Kai Polsterer領(lǐng)導(dǎo)著天文信息學(xué)小組，這是一個(gè)專注于新的，以數(shù)據(jù)為中心的天體物理學(xué)方法的研究小組。最近，他們一直在使用機(jī)器學(xué)習(xí)算法從星系數(shù)據(jù)集中提取紅移信息，這在以前是一項(xiàng)艱巨的任務(wù)。

Polsterer認(rèn)為這些新的基于人工智能的系統(tǒng)是“勤奮的助手”，可以連續(xù)數(shù)小時(shí)梳理數(shù)據(jù)而不會(huì)對(duì)工作條件感到厭倦或抱怨。他說，這些系統(tǒng)可以完成所有繁瑣乏味的工作，讓你“自己做一些很酷而有趣的科學(xué)”。

但他們并不好。Polstere警告說，算法只能做他們訓(xùn)練過的事情。系統(tǒng)對(duì)輸入是“不可知的”。給它一個(gè)星系，軟件就可以估計(jì)它的紅移和它的年齡，但是給同一個(gè)系統(tǒng)提供自拍照或腐爛的魚的圖片，它也會(huì)輸出一個(gè)（非常錯(cuò)誤的）年齡。他說，最終人類科學(xué)家的監(jiān)督仍然至關(guān)重要。

對(duì)于他而言，Nord在費(fèi)米實(shí)驗(yàn)室警告說，神經(jīng)網(wǎng)絡(luò)不僅要提供結(jié)果，而且要提供誤差條，就像每個(gè)本科生都需要接受訓(xùn)練一樣。他說，在科學(xué)領(lǐng)域，如果你進(jìn)行測量卻不報(bào)告相關(guān)誤差的估計(jì)，那么沒有人會(huì)認(rèn)真對(duì)待這些結(jié)果。

像許多人工智能研究人員一樣，Nord也關(guān)注神經(jīng)網(wǎng)絡(luò)產(chǎn)生的結(jié)果的不可穿透性；通常，系統(tǒng)給出一個(gè)答案而不提供如何獲得結(jié)果的清晰圖像。

然而，并非每個(gè)人都認(rèn)為缺乏透明度必然是一個(gè)問題。法國CEA Saclay理論物理研究所的研究員LenkaZdeborová指出，人類的直覺往往同樣難以理解。你看一張照片，立即認(rèn)出一只貓，但其實(shí)你不知道自己的大腦是如何思考的，就像是一個(gè)黑匣子一樣。

不僅天體物理學(xué)家和宇宙學(xué)家正在向人工智能推動(dòng)的數(shù)據(jù)驅(qū)動(dòng)科學(xué)發(fā)展。像Perimeter理論物理研究所和安大略滑鐵盧大學(xué)的Roger Melko這樣的量子物理學(xué)家已經(jīng)使用神經(jīng)網(wǎng)絡(luò)來解決該領(lǐng)域中一些最棘手和最重要的問題，例如如何表示描述a的數(shù)學(xué)“波函數(shù)”多粒子系統(tǒng)。 AI是必不可少的，因?yàn)镸elko稱之為“維數(shù)的指數(shù)性詛咒?！币簿褪钦f，波函數(shù)形式的可能性隨著它描述的系統(tǒng)中的粒子數(shù)量呈指數(shù)增長。難度類似于嘗試在象棋或圍棋這樣的游戲中找出好走法：你試圖向前看下一個(gè)走法，想象你的對(duì)手會(huì)玩什么，然后選擇最好的回應(yīng)，但每次動(dòng)作，可能性就會(huì)激增。

當(dāng)然，人工智能系統(tǒng)已經(jīng)掌握了這兩款游戲幾十年前的國際象棋以及2016年的圍棋，當(dāng)時(shí)稱為AlphaGo的AI系統(tǒng)擊敗了一名頂級(jí)人類玩家。 Melko表示，它們同樣適用于量子物理學(xué)中的問題。

機(jī)器的思想

無論Schawinski是否正確地聲稱他找到了做科學(xué)的“第三條道路”，或者像Hogg所說的那樣，它只是傳統(tǒng)的觀察和數(shù)據(jù)分析，很明顯AI正在改變科學(xué)發(fā)現(xiàn)的味道，而且它是肯定會(huì)加速它。那么，人工智能革命將在科學(xué)方面走多遠(yuǎn)？

有時(shí)，人們對(duì)“機(jī)器人科學(xué)家”的成就提出了很大的要求。十年前，一位名叫亞當(dāng)?shù)腁I機(jī)器人化學(xué)家研究了面包酵母的基因組，并研究出哪些基因負(fù)責(zé)制造某些氨基酸。（亞當(dāng)通過觀察某些基因缺失的酵母菌菌株，并將結(jié)果與具有這些基因的菌株的行為進(jìn)行比較來做到這一點(diǎn)。）《有線》雜志的標(biāo)題是“機(jī)器人通過自身進(jìn)行科學(xué)發(fā)現(xiàn)”。

要有創(chuàng)意，你必須討厭無聊。而且我不認(rèn)為電腦會(huì)覺得無聊。

最近，格拉斯哥大學(xué)的化學(xué)家Lee Cronin一直在使用機(jī)器人隨機(jī)混合化學(xué)物質(zhì)，看看形成了什么樣的新化合物。通過質(zhì)譜儀、核磁共振儀和紅外光譜儀實(shí)時(shí)監(jiān)測反應(yīng)，系統(tǒng)最終學(xué)會(huì)預(yù)測哪種組合最具反應(yīng)性?？肆_寧表示，即使不能進(jìn)一步發(fā)現(xiàn)，機(jī)器人系統(tǒng)也可以讓化學(xué)家將研究速度提高90％左右。

去年，蘇黎世聯(lián)邦理工學(xué)院的另一個(gè)科學(xué)家團(tuán)隊(duì)使用神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)集中推導(dǎo)出物理定律。他們的系統(tǒng)，一種類似于機(jī)器人開普勒，從地球上看到的太陽和火星在天空中的位置記錄重新發(fā)現(xiàn)了太陽系的日心模型，并通過觀察碰撞球來計(jì)算出動(dòng)量守恒定律。由于物理定律通常可以不止一種方式表達(dá)，研究人員想知道該系統(tǒng)是否可能提供新方法，也許是更簡單的方法，來思考已知的定律。

這些都是AI啟動(dòng)科學(xué)發(fā)現(xiàn)過程的例子，盡管在每種情況下，我們都可以討論新方法的革命性。也許最具爭議的問題是，僅從數(shù)據(jù)中就能收集到多少信息——在這個(gè)數(shù)據(jù)堆積如山(而且還在不斷增加)的時(shí)代，這是一個(gè)緊迫的問題。無論何時(shí)你看到一篇論文或研究都以無模型的方式分析數(shù)據(jù)時(shí)，你可以確定研究的結(jié)果只是總結(jié)，也許是變換，而不是解釋數(shù)據(jù)。

分享文章：人工智能加持，已經(jīng)擋不住科學(xué)的步伐了
文章來源：http://www.muchs.cn/news11/101211.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站建設(shè)、網(wǎng)站改版、網(wǎng)站設(shè)計(jì)、服務(wù)器托管、虛擬主機(jī)、定制開發(fā)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

失控的傳統(tǒng)IT，進(jìn)擊的云計(jì)算 2021-02-16
linux深度使用體驗(yàn) 2021-02-16
服務(wù)器、IP、域名三者什么關(guān)系？ddos攻擊為什么換ip？ 2021-02-16
創(chuàng)造屬于你的小程序 2021-02-16
小程序如何為企業(yè)打造品牌 2021-02-16

人工智能加持，已經(jīng)擋不住科學(xué)的步伐了

人工智能加持，已經(jīng)擋不住科學(xué)的步伐了