人工智能領(lǐng)域很多引人注目的進(jìn)展并不真實(shí)

新智元報(bào)道

創(chuàng)新互聯(lián)建站專注于蒼南網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供蒼南營銷型網(wǎng)站建設(shè),蒼南網(wǎng)站制作、蒼南網(wǎng)頁設(shè)計(jì)、蒼南網(wǎng)站官網(wǎng)定制、小程序定制開發(fā)服務(wù),打造蒼南網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供蒼南網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。

來源:Science

編輯:白峰

【新智元導(dǎo)讀】近日,一名MIT的自由科學(xué)家Hutson在Science發(fā)文,抨擊「人工智能的一些進(jìn)展并不真實(shí)」,MIT研究人員對(duì)當(dāng)前的一些AI論文進(jìn)行了系統(tǒng)評(píng)估后發(fā)現(xiàn),新模型和之前的經(jīng)典模型結(jié)果相差并不大,論文作者宣稱的效果提升大部分是舊模型的微小改動(dòng),并采用了不同的評(píng)價(jià)標(biāo)準(zhǔn)。

人工智能似乎變得越來越聰明。每一部 iPhone 都比上一部更好地了解你的面孔、聲音和習(xí)慣,各種性能的提升真的是來自算法的創(chuàng)新嗎?

Matthew Hutson

多數(shù)算法改進(jìn)缺乏創(chuàng)新性

麻省理工學(xué)院(MIT)計(jì)算機(jī)科學(xué)專業(yè)的研究生戴維斯 布拉洛克(Davis Blalock)表示,有些算法改進(jìn)來自微調(diào),而不是發(fā)明者聲稱的核心創(chuàng)新,而且有些改進(jìn)可能根本不存在。

Blalock 和他的同事比較了幾十種改進(jìn)神經(jīng)網(wǎng)絡(luò)的方法?!肝覀兪崂砹?0篇論文,但是我們?nèi)匀徊恢雷钕冗M(jìn)的技術(shù)到底是什么?!?/p>

研究人員評(píng)估了81種剪枝算法,這些剪枝算法主要是裁剪一些不必要的連接以提高神經(jīng)網(wǎng)絡(luò)效率。所有人都都變著法說自己的算法是最好的, 但他們很少進(jìn)行公允的有說服力的比較ーー當(dāng)研究人員把這些算法放在同一標(biāo)準(zhǔn)下評(píng)估時(shí),10年的時(shí)間,并沒有什么顯著的改善。

以剪枝算法為例,質(zhì)疑這些論文主要原因有以下幾點(diǎn):

缺乏一個(gè)完備的比較。2010年之前的算法沒有加入評(píng)估,最近的更新也沒有,對(duì)比較多的是VGG、ResNet這些經(jīng)典架構(gòu),而最新的EfficientNet則很少。

你用了ImageNet,好我用CIFAR;什么你也用CIFAR,RseNet架構(gòu)?那我用CIFAR和VGG。。

數(shù)據(jù)集和神經(jīng)網(wǎng)絡(luò)架構(gòu)都不統(tǒng)一,得出的結(jié)論實(shí)在很難讓人信服。

評(píng)價(jià)指標(biāo)不一致,結(jié)果描述不完整。僅從效率和準(zhǔn)確率無法評(píng)估出模型的對(duì)比效果。只有一篇論文使用了標(biāo)準(zhǔn)差來評(píng)估整體的趨勢(shì)。

還有一點(diǎn)就是大家用的數(shù)據(jù)預(yù)處理方法、超參數(shù)的調(diào)整策略,使用的框架,剪枝和微調(diào)介入的時(shí)期等都沒有統(tǒng)一,這些都會(huì)導(dǎo)致結(jié)果的不同。比如同樣的算法,有些PyTorch的實(shí)現(xiàn)就比TensorFlow的好,當(dāng)然反過來也有可能。

水論文到底在玩什么把戲?

今年三月份在MLSys上公布的結(jié)果讓 Blalock 的博士導(dǎo)師,麻省理工學(xué)院的計(jì)算機(jī)科學(xué)家 John Guttag 感到驚訝,「這種不平衡的比較本身就可以解釋為什么停滯不前了」。這是老一套了,對(duì)吧?

從當(dāng)前主流的機(jī)器學(xué)習(xí)架構(gòu)來看,機(jī)器學(xué)習(xí)算法的收益主要來自其結(jié)構(gòu)、損失函數(shù)或優(yōu)化策略的根本性變化。

卡內(nèi)基梅隆大學(xué)的計(jì)算機(jī)科學(xué)家 Zico Kolter 研究圖像識(shí)別模型,該模型被訓(xùn)練后可以對(duì)黑客的「對(duì)抗性攻擊」免疫。

一種早期的對(duì)抗性訓(xùn)練方法投影梯度下降法(PGD) ,現(xiàn)在一些更復(fù)雜的方法看似超越了PGD,但是在二月份的 arXiv 論文中,Kolter 和他的同事們發(fā)現(xiàn),只需要一個(gè)簡單的技巧來增強(qiáng)PGD,所有這些方法的效果都差不多。

論文灌水成風(fēng),但剪枝算法建議別發(fā)了

網(wǎng)友對(duì)如今AI論文灌水之風(fēng)也是頗有微詞,比如NIPS2018入選千篇。

知乎網(wǎng)友@Xiang Wang提出,論文要么跟實(shí)際貼合提升業(yè)務(wù),要么就是理論創(chuàng)新,但是很多論文兩者都沒有做到,純用捏造,實(shí)在是尷尬。

即使新方法并不比舊方法好到哪里去,每隔一段時(shí)間也會(huì)有一個(gè)新的算法實(shí)現(xiàn)應(yīng)用上的突破, 「這幾乎就像一個(gè)風(fēng)險(xiǎn)投資組合,其中一些東西并沒有真正發(fā)揮作用,但一些業(yè)務(wù)卻表現(xiàn)出色」。

一些工業(yè)界看起來很好的效果可能是因?yàn)樵擃I(lǐng)域的爆炸性增長,論文數(shù)量超過了有經(jīng)驗(yàn)的審稿人。評(píng)審人員時(shí)間緊任務(wù)重,只與基準(zhǔn)進(jìn)行比較,很容易得出偏見性的結(jié)論。

今年早些時(shí)候,Blalock 的合著者,麻省理工學(xué)院的研究員 Jose Gonzalez Ortiz,發(fā)布了一款名為 ShrinkBench 的軟件,該軟件是基于PyTorch并且是開源的,它使得比較剪枝算法變得更加容易,以后再發(fā)這類的論文可要注意了!

參考鏈接:

https://www.zhihu.com/question/59002888)

https://www.sciencemag.org/news/2020/05/eye-catching-advances-some-ai-fields-are-not-real)

https://proceedings.mlsys.org/static/paper_files/mlsys/2020/73-Paper.pdf

當(dāng)前文章:人工智能領(lǐng)域很多引人注目的進(jìn)展并不真實(shí)
網(wǎng)站URL:http://muchs.cn/article4/cjheie.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供商城網(wǎng)站、域名注冊(cè)、品牌網(wǎng)站建設(shè)網(wǎng)站內(nèi)鏈、微信小程序虛擬主機(jī)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)公司