國際舞臺(tái)盡顯中國AI硬實(shí)力

原標(biāo)題:國際舞臺(tái)盡顯中國AI硬實(shí)力

近日,全球計(jì)算機(jī)視覺頂會(huì)CVPR 2020首次召開線上大會(huì),百度不僅入選22篇接收論文,一舉拿下8項(xiàng)挑戰(zhàn)賽冠軍,涵蓋視頻動(dòng)作分析、動(dòng)作識(shí)別、圖像增強(qiáng)、智慧城市等多個(gè)領(lǐng)域,還主辦了2場(chǎng)重量級(jí)學(xué)術(shù)Workshop,在國際舞臺(tái)盡顯中國AI硬實(shí)力。這不僅從側(cè)面反映了百度傾斜AI“新基建”的策略已有成效,也再次讓中國自有的深度學(xué)習(xí)平臺(tái)飛槳閃耀全球。

創(chuàng)新互聯(lián)專注于蘆溪網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供蘆溪營銷型網(wǎng)站建設(shè),蘆溪網(wǎng)站制作、蘆溪網(wǎng)頁設(shè)計(jì)、蘆溪網(wǎng)站官網(wǎng)定制、小程序設(shè)計(jì)服務(wù),打造蘆溪網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供蘆溪網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。

國際計(jì)算機(jī)視覺和模式識(shí)別大會(huì)(CVPR)一直有計(jì)算機(jī)視覺領(lǐng)域的“奧斯卡”之稱,憑借著嚴(yán)苛的論文錄取標(biāo)準(zhǔn),躋身全球AI頂會(huì)之流。實(shí)際上,CVPR是全球參與者檢驗(yàn)自身AI“基本功”的試金石。受到全球疫情影響,CVPR 2020改為6月14-19日舉行線上大會(huì);讓人喜出望外的是,華人學(xué)者及團(tuán)隊(duì)大放異彩,向全球展示AI實(shí)力。

CVPR2020上,大會(huì)論文錄取率僅有22%,百度入選22篇論文,較上年增加5篇;在視頻動(dòng)作分析、動(dòng)作識(shí)別、圖像增強(qiáng)、智慧城市等挑戰(zhàn)賽中,百度與全球科技巨頭同臺(tái)競(jìng)技,斬獲8項(xiàng)世界冠軍,站上計(jì)算機(jī)視覺“頂流”之席;同時(shí),百度還舉辦2場(chǎng)高水準(zhǔn)Workshop,并有多篇Workshop論文被接收。

百度不僅通過多種形式深度參與CVPR 2020,也積極為推動(dòng)行業(yè)技術(shù)發(fā)展做貢獻(xiàn)。在全球經(jīng)濟(jì)發(fā)展重心逐漸偏移智能經(jīng)濟(jì),中國聚焦AI“新基建”時(shí),百度已準(zhǔn)備充分。在CVPR 2020上,百度正在依托包括百度大腦、飛槳等新型AI技術(shù)基礎(chǔ)設(shè)施,獲得不俗成績(jī);此后也將秉持開源、共贏原則,為中國AI行業(yè)輸出“車輪”,推動(dòng)AI“新基建”發(fā)展。接下來回到AI競(jìng)賽的試煉場(chǎng),看看百度的AI基本功。

百度斬獲8項(xiàng)競(jìng)賽奪冠大秀中國AI水平

CVPR2020覆蓋計(jì)算機(jī)視覺眾多熱門子領(lǐng)域,其中,百度參與并奪冠多個(gè)領(lǐng)域的挑戰(zhàn)賽:

1、 視頻動(dòng)作分析挑戰(zhàn)賽,專注于提升視頻標(biāo)注效率;

2、 動(dòng)作識(shí)別挑戰(zhàn)賽,技術(shù)成果可廣泛用于可穿戴設(shè)備和智能家居;

3、 圖像增強(qiáng)挑戰(zhàn)賽,可有效提高視頻質(zhì)量;

4、 智慧城市挑戰(zhàn)賽,可有效優(yōu)化現(xiàn)有城市交通管理,提升管理效率,推動(dòng)智能化進(jìn)程。

百度奪冠的具體挑戰(zhàn)賽及其賽道如下圖所示,共計(jì)奪冠8項(xiàng)冠軍。

ActivityNet2020挑戰(zhàn)賽

ActivityNet挑戰(zhàn)賽是視頻理解領(lǐng)域最具影響力賽事,其中的時(shí)序動(dòng)作定位賽道(弱監(jiān)督)(HACS temporal action localization —Track2: weakly supervised)主要考驗(yàn)參賽者能否通過弱標(biāo)簽、弱監(jiān)督方式有效提升現(xiàn)有視頻動(dòng)作檢測(cè)算法的效率。百度最終擊敗其余參賽隊(duì)伍,以mAP39.29的得分位居第一。

這項(xiàng)比賽中,百度通過自研BMN模型對(duì)視頻序列提取候選框,并結(jié)合弱標(biāo)簽訓(xùn)練數(shù)據(jù),提出級(jí)聯(lián)金字塔注意力網(wǎng)絡(luò)進(jìn)行打標(biāo)簽動(dòng)作,兩者結(jié)合最終獲取片段定位及動(dòng)作標(biāo)簽。該技術(shù)對(duì)高效的視頻數(shù)據(jù)使用具有指導(dǎo)意義,可應(yīng)用于視頻Highlight檢測(cè)、精彩集錦等多個(gè)場(chǎng)景。

EPIC-Kitchens2020挑戰(zhàn)賽

EPIC-Kitchens2020挑戰(zhàn)賽聚焦于第一人稱視頻理解,其技術(shù)可廣泛應(yīng)用于可穿戴設(shè)備、智能家居、人機(jī)交互等方面。在這次挑戰(zhàn)賽的動(dòng)作識(shí)別(Action Recognition)賽道中,百度打敗三星劍橋AI研究院、牛津大學(xué)、佐治亞理工大學(xué)等40+支隊(duì)伍,最終在Seen kitchens和Unseen kitchens兩項(xiàng)測(cè)試集上均以第一名的成績(jī)摘獲冠軍。

針對(duì)比賽中第一人稱視頻小物體多、相機(jī)運(yùn)動(dòng)模糊嚴(yán)重等難點(diǎn),百度提出共生注意力機(jī)制和以物體為中心的對(duì)齊模塊,大幅提升3D卷積網(wǎng)絡(luò)的性能。該方法可在多種視頻Backbone和輸入模態(tài)下取得一致的性能提升。

NTIRE2020挑戰(zhàn)賽

NTIRE(New Trends in Image Restoration and Enhancement)是近年來計(jì)算機(jī)圖像修復(fù)領(lǐng)域最具影響力的一場(chǎng)賽事,每年都會(huì)吸引大量的關(guān)注者和參賽者。百度積極參與NTIRE2020挑戰(zhàn)賽,并在2項(xiàng)賽道上拿下冠軍:

1、 真實(shí)圖像降噪賽道(Real Image Denoising rawRGB Track)

2、 視頻質(zhì)量映射賽道(Video Quality Mapping—Track1: Supervised)

真實(shí)圖像降噪賽道

圖像降噪作為計(jì)算機(jī)視覺熱門領(lǐng)域,在視頻監(jiān)控、無人駕駛、移動(dòng)可穿戴設(shè)備、遙感及醫(yī)學(xué)圖像分析等領(lǐng)域應(yīng)用廣泛。對(duì)于NTIRE2020挑戰(zhàn)賽的真實(shí)圖像降噪賽道(Real Image Denoising rawRGB Track),其首要目標(biāo)是去除或糾正圖像上的噪聲信息,百度最終以第一的成績(jī)達(dá)成目標(biāo),奪得冠軍。

針對(duì)該項(xiàng)競(jìng)賽,百度設(shè)計(jì)了多跳躍連接的密集殘差模塊學(xué)習(xí)不同分辨率下的特征表達(dá),并通過創(chuàng)新性mosaic-stride模塊提升rawRGB的降噪能力,同時(shí)使用分布式SA-NAS搜索最優(yōu)的模型結(jié)構(gòu);其中,SA-NAS搜索方法是百度首次把NAS技術(shù)應(yīng)用于圖像降噪領(lǐng)域。

視頻質(zhì)量映射賽道

視頻質(zhì)量映射賽道(Video Quality Mapping—Track1: Supervised)關(guān)注于圖片視頻底層視覺技術(shù)的關(guān)鍵問題。這一技術(shù)可有效提高視頻質(zhì)量,提升用戶觀看體驗(yàn)。百度憑借過硬的視覺技術(shù)和經(jīng)驗(yàn)積累,取得了該賽道的冠軍成績(jī)。

針對(duì)該賽道的問題,百度通過把現(xiàn)有EDVR模型思路與CNN網(wǎng)絡(luò)結(jié)構(gòu)DenseNet相結(jié)合,利用DenseNet提取視頻的圖片特征,融合CNN淺層與深層特征,從而實(shí)現(xiàn)更強(qiáng)的表達(dá)能力;EDVR模型則完成了視頻幀之間信息交換,對(duì)齊幀間信息,實(shí)現(xiàn)信息共享與互補(bǔ)。

AI CITY2020挑戰(zhàn)賽

AI CITY2020挑戰(zhàn)賽由英偉達(dá)、亞馬遜、馬里蘭大學(xué)等主辦,主要集中在交通相關(guān)的車輛跟蹤、再識(shí)別、異常事件分析等應(yīng)用場(chǎng)景。AI CITY智慧城市挑戰(zhàn)賽的4項(xiàng)比賽中,全球共有315支隊(duì)伍參加,其中不乏阿里、滴滴、松下、卡內(nèi)基梅隆大學(xué)等一流科技巨頭和高校。百度共參戰(zhàn)3項(xiàng)競(jìng)賽,最終技?jí)喝盒?,全部取得了冠軍成?jī):

1、 車流統(tǒng)計(jì)(Track 1:Multi-Class Multi-Movement Vehicle Counting)

2、 車輛再識(shí)別(Track 2:City-Scale Multi-Camera Vehicle Re-Identification)

3、異常事件檢測(cè)(Track 4:Traffic Anomaly Detection)

車流統(tǒng)計(jì)賽道

在車流統(tǒng)計(jì)賽道中,參賽者需要解決車輛遮擋、復(fù)雜天氣下的視覺差異等問題。百度提出“檢測(cè)-跟蹤-計(jì)數(shù)”結(jié)合的車流統(tǒng)計(jì)算法流程,有效解決了檢測(cè)框丟失和ID翻轉(zhuǎn)問題。在車流統(tǒng)計(jì)環(huán)節(jié),提出基于數(shù)據(jù)驅(qū)動(dòng)的軌跡匹配分類算法使統(tǒng)計(jì)結(jié)果更準(zhǔn)確。

百度從運(yùn)算用時(shí)、運(yùn)算速度等維度均位列第一,奪得該賽道冠軍。而這一套算法模型,則離不開百度在城市交通大腦方面的數(shù)據(jù)積累和洞察,在保定市百度AI交管大腦項(xiàng)目中,智慧信控系統(tǒng)有效提升了交通效率的20%-30%。

車輛重識(shí)別賽道

車輛重識(shí)別旨在確認(rèn)智能交通系統(tǒng)中的車輛身份,在城市安全場(chǎng)景中發(fā)揮著不可替代的作用。該賽道基于真實(shí)場(chǎng)景數(shù)據(jù),對(duì)參賽者提出監(jiān)控視角變化大、標(biāo)注數(shù)據(jù)少等挑戰(zhàn)。百度憑借智慧城市領(lǐng)域的技術(shù)優(yōu)勢(shì),以明顯優(yōu)勢(shì)甩開41支參賽隊(duì),最終以mAP 84.13%的成績(jī)登臨首位。

為應(yīng)對(duì)任務(wù)挑戰(zhàn),百度設(shè)計(jì)了基于多任務(wù)多分支的網(wǎng)絡(luò)模型,并結(jié)合多源信息融合的重識(shí)別技術(shù)方案。在數(shù)據(jù)方面,使用風(fēng)格遷移、圖像內(nèi)容編輯、背景替代等多種方法生成合成數(shù)據(jù),以彌補(bǔ)訓(xùn)練數(shù)據(jù)不足的問題。

異常事件檢測(cè)賽道

異常事件檢測(cè)賽道主要考驗(yàn)參賽者對(duì)交通場(chǎng)景的復(fù)雜性、交通流的密集混亂性、天氣和車輛大小的多樣性以及異常標(biāo)注數(shù)據(jù)缺乏等問題的解決能力。此技術(shù)可以提前發(fā)現(xiàn)潛在的交通風(fēng)險(xiǎn)、提前預(yù)警交通管理部門、提升交通風(fēng)險(xiǎn)的處理能力和效率。百度在該賽道表現(xiàn)優(yōu)異,取得98.5%的F1成績(jī),均方根誤差為4.8737,比賽成績(jī)排名第一。

針對(duì)此挑戰(zhàn)賽,百度通過模塊化的多粒度跟蹤方法,將跟蹤問題解耦成不同子問題,利用不同模塊來處理不同子任務(wù),同時(shí)將視頻進(jìn)行正序和逆序分別建模,最后利用一種融合和回溯優(yōu)化方法,將多個(gè)子任務(wù)以及正序、逆序的模型進(jìn)行融合得到最終異常事件的定位結(jié)果。

MOTS2020挑戰(zhàn)賽

MOTS (Multi-Object Tracking and Segmentation) 多目標(biāo)跟蹤與實(shí)例分割挑戰(zhàn)賽由德國慕尼黑大學(xué)、德國亞琛工業(yè)大學(xué)、ETH聯(lián)合舉辦,是多目標(biāo)跟蹤方向的權(quán)威競(jìng)賽。該挑戰(zhàn)賽均是計(jì)算機(jī)視覺頂會(huì)CVPR的議程之一,可以直觀反映參賽者真實(shí)的應(yīng)用能力。百度最終憑借原創(chuàng)自研的領(lǐng)先技術(shù),拿下KITTI-MOTS賽道賽道冠軍

KITTI-MOTS賽道是自動(dòng)駕駛權(quán)威數(shù)據(jù)集KITTI中多目標(biāo)跟蹤任務(wù)的擴(kuò)展,也是首個(gè)同時(shí)提供實(shí)例分割以及多目標(biāo)跟蹤標(biāo)注的公開數(shù)據(jù)集。在KITTI-MOTS競(jìng)賽中,百度提出新型方法PointTrack++,在行人和車輛兩個(gè)類別中均取得冠軍。

具體而言,PointTrack++包括視頻實(shí)例分割、掩膜特征提取以及多目標(biāo)關(guān)聯(lián)跟蹤等技術(shù),突破性地把3D點(diǎn)云分析融入2D MOTS任務(wù)之中,首次實(shí)現(xiàn)實(shí)時(shí)在線的MOTS算法,并在車輛場(chǎng)景測(cè)評(píng)指標(biāo)上領(lǐng)先第二名3個(gè)百分點(diǎn)以上,實(shí)現(xiàn)SOTA結(jié)果。

百度舉辦2場(chǎng)高水準(zhǔn)Workshop 推進(jìn)學(xué)術(shù)交流

Learning from Imperfect Data (LID) Workshop主要討論如何在不完美數(shù)據(jù)標(biāo)注的條件下,通過機(jī)器學(xué)習(xí)算法訓(xùn)練出高精度的視覺識(shí)別模型。百度作為L(zhǎng)ID Workshop組織者,參與設(shè)計(jì)了弱監(jiān)督物體分割、弱監(jiān)督場(chǎng)景解析、弱監(jiān)督物體定位三項(xiàng)競(jìng)賽(Track)。值得一提的是,兩支冠軍隊(duì)伍提交了基于飛槳的代碼。

CVPR2020 workshop on Media Forensics由百度聯(lián)合舉辦,旨在發(fā)揮人臉防偽檢測(cè)保護(hù)人臉識(shí)別系統(tǒng)免受惡意攻擊的重要作用,并吸引來自學(xué)界/業(yè)界共340支參賽隊(duì)伍,最終有19支隊(duì)伍進(jìn)入決賽并提交了模型與代碼。

網(wǎng)站標(biāo)題:國際舞臺(tái)盡顯中國AI硬實(shí)力
網(wǎng)站URL:http://muchs.cn/article2/cjhsoc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器、ChatGPT品牌網(wǎng)站設(shè)計(jì)、搜索引擎優(yōu)化網(wǎng)站制作、微信小程序

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

小程序開發(fā)