百度地圖覃夢龍:大數(shù)據(jù)時代與智能交通

互聯(lián)網(wǎng)IDC圈4月27日報道,互聯(lián)網(wǎng)的發(fā)展使得大數(shù)據(jù)引起人們廣泛關(guān)注?,F(xiàn)如今大數(shù)據(jù)技術(shù)早已滲透到金融、通訊等行業(yè)以及生物學(xué)、物理學(xué)等領(lǐng)域。大數(shù)據(jù)在容量、多樣性和高增速方面的爆炸式增長全面考驗著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力,與此同時也為各個行業(yè)帶來了準(zhǔn)確洞察市場行為的機會。迄今為止大數(shù)據(jù)技術(shù)與產(chǎn)品有哪些創(chuàng)新,工業(yè)大數(shù)據(jù)應(yīng)用面臨哪些挑戰(zhàn),金融行業(yè)大數(shù)據(jù)應(yīng)用現(xiàn)狀如何等。圍繞這一系列問題,4月27日至28日,由工業(yè)和信息化部指導(dǎo)、中國信息通信研究院主辦的"2016大數(shù)據(jù)產(chǎn)業(yè)峰會"在北京國際會議中心盛大召開。

為荊門等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及荊門網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都做網(wǎng)站、成都網(wǎng)站建設(shè)、成都外貿(mào)網(wǎng)站建設(shè)、荊門網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!

其中,在4月27日下午“大數(shù)據(jù)與城市交通”分論壇上,百度公司百度地圖基礎(chǔ)業(yè)務(wù)部高級經(jīng)理覃夢龍發(fā)表了精彩演講。

500-333文章照片-大數(shù)據(jù)與城市交通-覃夢龍

百度公司百度地圖基礎(chǔ)業(yè)務(wù)部高級經(jīng)理覃夢龍

以下為覃夢龍演講實錄:

覃夢龍:大家好,很榮幸被邀請來參加大數(shù)據(jù)峰會,我是代表百度地圖基礎(chǔ)業(yè)務(wù)部代表研發(fā)跟大家分享大數(shù)據(jù)交通,我們作為一個互聯(lián)網(wǎng)公司,對于智能交通上面我感覺發(fā)言權(quán)不會特別高,但是百度地圖大家可以看到在市場占有率也是數(shù)一數(shù)二的情況。我們怎么利用大數(shù)據(jù)時代跟智能交通結(jié)合,做成我們一家互聯(lián)網(wǎng)企業(yè)呢?

首先我們看一下百度大數(shù)據(jù)的簡介,互聯(lián)網(wǎng)地圖誕生已經(jīng)十年左右的時間,互聯(lián)網(wǎng)地圖從紙質(zhì)到電子地圖的轉(zhuǎn)變,紙質(zhì)地圖無法實時更新,W互聯(lián)網(wǎng)地圖是實時在線和實時數(shù)據(jù)更新,根據(jù)不同的路線情況和交通情況可以做改進,應(yīng)用程序,包括基本功能都通過一些開放接口讓開發(fā)者,或者說研究中心可以去調(diào)用。

這個圖大家可以看到,我們整個互聯(lián)網(wǎng)拉近了人和人的距離。為什么這么說?大家可以看到從211年5月份開始到2015年3月份月活躍用戶數(shù)3.6億,活躍度73%,在國內(nèi)排名第一,季度環(huán)比增速超過45%,百度地圖作為一個地圖商產(chǎn)品,其實歸結(jié)為百度大數(shù)據(jù)很好的利用。百度地圖大家都知道其他的核心功能大家打開APP都能看到,公交、駕車、出行,包括深度功能,比如實時公交、路況和語音導(dǎo)航包括停車場推實時推送,百度在這方面有什么優(yōu)勢?百度地圖作為一個技術(shù)工具,其實不僅僅是存在了地圖的功能,更多的基于位置提供服務(wù),比如說酒店、用車、以及外賣、美食、電影和旅游,大家在一些位置情況下面大家可以嘗試不同的便利交通和規(guī)劃,更多的實時交通方面的體驗。

這是道路數(shù)據(jù)生產(chǎn)鏈概覽,區(qū)別于傳統(tǒng)提供商,衛(wèi)星影像,長地,政府來源,他們關(guān)鍵技術(shù)是大數(shù)據(jù)挖掘、多源數(shù)據(jù)融合,深度學(xué)習(xí),但是百度地圖可以做全網(wǎng)分析,為什么這樣說?因為百度地圖不僅僅是傳統(tǒng)更新路網(wǎng),更多是做采集挖掘技術(shù)提取數(shù)據(jù),然后進行多網(wǎng)融合,并實現(xiàn)在線實時錄像。

我們可以看到百度地圖大數(shù)據(jù)的數(shù)據(jù),剛剛騰訊同事也提到了,比如說用戶規(guī)模,市場份額,以及每天響應(yīng)定位請求,百度地圖日均定位UV5億+,用戶份額排名73%,用戶規(guī)模3億+,所以更多的是基于車輛用戶、出行和導(dǎo)航,所以交通這個領(lǐng)域百度地圖數(shù)據(jù)質(zhì)量上面是有天然的優(yōu)勢的。

大家可以看到大數(shù)據(jù)規(guī)模我們從哪方面去看,比如公交路線,以及定位請求次數(shù),以及我們的WIFI定位精度,還有包括用戶量,還有POI數(shù)據(jù),POI3800萬數(shù)據(jù)有很多商業(yè)部門跑的,還有一些商家店鋪,還有一些全景視力圖。大家看到2013年百度每天35億次定位請求,主要是東部和發(fā)達地區(qū)。到2014年就得到一個非常猛烈的發(fā)展,在西部和東部地區(qū)更多人開使用,在一些偏遠地區(qū)西部地區(qū)開始用百度地圖來進行定位;而到2015年,每天相應(yīng)四30億次定位請求,這里面包括手百和糯米開發(fā)者,他們都在全球使用百度POI,大家知道百度不僅是中國互聯(lián)網(wǎng)企業(yè),搜索走向國際化,百度地圖發(fā)布了18個亞太地區(qū)的地圖服務(wù),今年底可能要發(fā)布180個國家所有地區(qū)的服務(wù)。

我們可以看看互聯(lián)網(wǎng)公司基于大數(shù)據(jù)的產(chǎn)品,就是高速以及城市路況,為什么拿路況這個來說?大家可以想象路況是什么樣,比如軌跡數(shù)據(jù)很足,我們知道數(shù)量是什么樣就知道路況是什么樣。為什么說大數(shù)據(jù)會這么重要?一會兒我會提。在百度路況會覆蓋到全國所有城市,如果三四線城市,主干道是都要覆蓋的。然后大數(shù)據(jù)的一些價值,比如說實時公交,當(dāng)你想去到哪個地方如果路線上面有公交車,上面會展現(xiàn)出最近的一趟公交車離你現(xiàn)在的地點還有多久,你可以更好的安排你的出行計劃,包括這個旅行時間估計,比如從某個地方到另外一個地方,其實OD之間的時間分段,我們會用時最少以及一些擁堵方案供大家選擇,這個是地圖核心的業(yè)務(wù)和核心價值,如果導(dǎo)航、公交或者是路況做的不好,其實地圖的用戶會很快的都會離開百度地圖。

還有一些大數(shù)據(jù)的挖掘價值,這部分價值我不會談的太多,因為這部分價值我覺得我們作為一個互聯(lián)網(wǎng)公司來說沒有太多的發(fā)言權(quán),比如說我們對這部分數(shù)據(jù)利用的還不夠充分,因為這些數(shù)據(jù)比如說政府和研究機構(gòu)以及學(xué)校對于這些數(shù)據(jù)怎么用應(yīng)該比我們了解更多,我們只是在數(shù)據(jù)里面挖出冰山一角,我們把數(shù)據(jù)發(fā)布出來,比如我們看春運的時候哪些城市更多人遷入和哪些城市更多人遷出,以及我們怎么選擇路線,以及某些節(jié)日,比如情人節(jié)時我們做什么流量推廣。

我現(xiàn)在說的更偏技術(shù)性的東西,就是我們智能交通計算平臺,這可以認為是百度地圖大腦。智能交通服務(wù)都有哪些?比如說我們可以看到的,截至到2014年底國家汽車保有量1.4億,國家2014年可以完全進入了汽車社會,在2013年到2015年由于移動互聯(lián)網(wǎng)發(fā)展,我們也進入了移動互聯(lián)網(wǎng)社會,我們有了移動互聯(lián)網(wǎng)更大的數(shù)據(jù)采集和更大的數(shù)據(jù)量,我們可以看到更大的數(shù)據(jù),比如說上海用戶平均每次擁堵是15分鐘,平均他們速度22千里每小時,這個速度大家可以認為是非常非常擁堵的,我們要做的智慧交通就是通過我們的智慧交通提供服務(wù)提高智慧效率。我們通過車輛調(diào)度、商圈選擇以及城市規(guī)劃,包括社會效率。我們整個平臺從上到下分為四個部分,第一個是應(yīng)用,基于我們這些數(shù)據(jù)做一些具體應(yīng)用,第二個是數(shù)據(jù)挖掘,第三個是數(shù)據(jù)分析,第四個是定位,剛剛說精準(zhǔn)定位是非常高,1多3米左右。數(shù)據(jù)我們跟合作方和政府合作數(shù)據(jù),這些數(shù)據(jù)比如說出租車數(shù)據(jù)高質(zhì)量,但是它覆蓋率存在不足,我們還有地圖導(dǎo)航數(shù)據(jù),這些數(shù)據(jù)非常大,但是非常差,那我們就要做數(shù)據(jù)清晰,比如地圖匹配,軌跡分類,拓撲構(gòu)建,我們把高質(zhì)量的引進來,把軌跡量不足的地方把它做泛化,把數(shù)據(jù)做補充。我們利用實時路況,時間估計,實時公交,包括新路發(fā)現(xiàn),因為有了新路發(fā)現(xiàn),我們才把地圖流程提升到天級或者是小時級別。

地圖匹配,我們不是運營商,所以我們拿到數(shù)據(jù)是運營商的點,他給我們就是這些點,那么我們需要就是把這些點還原成他所謂的軌跡,而且這些軌跡需要自造,而且有些點離的非常遠,有些可能比如從汽車已經(jīng)轉(zhuǎn)換成步行,我們會把這些點通過建模轉(zhuǎn)換成這樣一個軌跡,我們對算法和模型有很多的要求,比如它具有很高的魯棒性。當(dāng)然這個用戶定位點缺失比較大,這樣保證我們的數(shù)據(jù)越來越的精確性。還有說K階HM圖,這條路是否通行,比如大家看到這個線,如果用戶在西直門立交橋那個地方是要繞道的,因為那個地方有一個限制。

實時路況我們首先要做分鐘更新,如果太慢就不會很準(zhǔn)確,如果更新更快,比如這個地方紅燈比較長,大家經(jīng)常會覺得紅燈會很堵,綠燈也會很暢通,對于產(chǎn)品我們不能把紅燈綠燈去做,我們會融合評估整個紅燈情況。第三個是全國覆蓋,如果一個數(shù)據(jù)沒有路況,其實用戶對這個路況是不信任的。我們把這些還原成軌跡之后,就會變成這個樣子,十分鐘或者二十分鐘之內(nèi)這條路段上面所有軌跡的趨勢圖,通過趨勢圖,我們可以看到這個路段它是從暢通開始慢慢地速度下降變成擁堵,但是它并沒有完全擁堵,加上我們計算和核算趨勢,把實時路段發(fā)送擁堵,實踐證明我們這個按趨勢模型算法,準(zhǔn)確率達到80%左右。

除此之外我們還會加入一些時空規(guī)則,舉個簡單例子,比如這個路段上面現(xiàn)在車輛很少,可能只有兩輛車,有一輛車開的非常慢,我們軌跡就看車開的非常慢,軌跡量很少,這個時候我們說這個車擁堵是不對的,因為他可能剛開車開的非常慢,所以我們結(jié)合他上一個時間速度開的非???,他慢速的可信度,通過實時模型和預(yù)測模型,整個路況率提升90%恩左右。

第三個比較難的就是時間估計,剛剛跟下面同學(xué)討論了一下,時間估計這個非常難做,難做的原因大家能想到,比如去一個地方需要50分鐘,我首先要拿到的數(shù)據(jù)就是以前的數(shù)據(jù),我們不能用當(dāng)前路況累加,當(dāng)前在車行使過程中會變,所以當(dāng)前路況不準(zhǔn)。維度用哪個維度,比如今天下雨和明天下雨不一樣,包括路面擁堵,今天擁堵和昨天擁堵通行時間也是不一樣,所以如果我們用路段累加方式會陷入災(zāi)難。第二個這種數(shù)據(jù)越遠的時候我們用累加方式,到后來累加的準(zhǔn)確率可能就會越來越低,就會造成擁堵的情況。

大家可能6月份會看到我們推出全新的一款百基于百度圖象識別和人臉識別類似的方式,給大家舉一個例子,人臉識別如果你用特征會陷入一個問題,人五官是特征,五官有五個特征,五官的五個特征可以相互組合可以形成更多的特征,他的左臉和右臉有很多特征,她今天畫眉毛明天不畫眉毛,你識別就不會準(zhǔn),因為她的眉毛會變。地圖LENING是什么方式?跟大家具體描述可能要一天一夜,簡單來說就是把時間、路況都丟進去,計算出來一個抽象的特征,這個抽象特征最后降為三到五個特征,通過這三到五個特征再去訓(xùn)練模型,這樣得到效果。包括這里面有大數(shù)據(jù)效果,基本上準(zhǔn)確率可以達到70%,以前可能是50%恩左右。50%就是詬病的狀態(tài),因為它就是準(zhǔn)和不準(zhǔn)之間。

第三個就是實時公交,就是互聯(lián)網(wǎng)企業(yè)可以認為是一種無奈或者是折中,以后互聯(lián)網(wǎng)企業(yè)不會有太多的公交信息,公交是政府手里,不可能開放給企業(yè)。公交數(shù)據(jù)有百度用戶的時候,他會得到WIFI點,基于WIFI點可能是根據(jù)POI,我們用POI來判斷這個用戶處于的位置來判斷實時定位,但是實時定位在大城市定位非常多,準(zhǔn)確率非常高,但是在小城市里面這種定位還是非常難的問題。

這個是新路發(fā)現(xiàn),為什么百度可以做到道路有些信息時可以做到天級別或者是小時級別更新,這個是分析原因,我們經(jīng)過地圖更新會實時匹配信息,比如會有天級別周量數(shù)據(jù)匹配,也小時級每天數(shù)據(jù)匹配,通過數(shù)據(jù)匹配發(fā)現(xiàn)出每天路網(wǎng)這個地方有軌跡,或者說這個地方以前沒有通行最近發(fā)現(xiàn)一些軌跡,我們在沒有匹配的道路去修道路,有匹配的就實時導(dǎo)航軌跡。

舉個例子,武鄂高速開通的時候,我們基于我們導(dǎo)向路線匹配這條新路,讓用戶更早的開到這條新路上面去。

這個其實就是現(xiàn)在百度地圖做的高精度地圖,現(xiàn)在大家知道無人車比較火,無人車無論是全自動還是半自動,這里面有一個基礎(chǔ)就是高經(jīng)地圖,第一方面是車載方面,另外一方面就是地圖綁定,車載地圖如何跟地圖綁定,這是涉及到高精地圖。地圖上面有高精度的坐標(biāo)系,比如這兩個POI中間有100米到50米,但是這種地圖不能給我們?nèi)詣悠囀褂?,對于汽車使用,它在開一半的時候采集到的圖像是周邊信息,它通過周邊信息精確地知道POI距離多遠,這個方面百度無人車和寶馬合作,在北京已經(jīng)實現(xiàn)了高速公路、城市路面以及主輔路實現(xiàn)自動駕駛的技術(shù)。

這個是高精度地圖導(dǎo)航,大概是5到100米,目標(biāo)是二維,百度高精度地圖是0.1米,坐標(biāo)是反過來可以解決路況和導(dǎo)航問題,因為路況和導(dǎo)航里面最難解決的問題如果大家有研究可能就知道主輔路,以及高架,這方面主輔路不準(zhǔn)。高架無法判定這個車是在高架橋上還是高架橋下,但是通過高精確地圖也就是我們能夠預(yù)見的下一代地圖這些問題都可以解決,比如說路況、導(dǎo)航。

下來我再給大家分析一些大數(shù)據(jù)的出行分析地這些出行分析我是不打算跟大家說太多,因為這部分基本上所有大數(shù)據(jù)都會做同樣的事情,我覺得百度優(yōu)勢在于數(shù)據(jù)量比較全,或者比較準(zhǔn),但是對于一個分析報告來說大家這些點基本上相似,但是這些讓大家知道的就是百度有哪些數(shù)據(jù),讓大家知道對百度更精細和更深度挖掘的時候可以聯(lián)系百度,這個數(shù)據(jù)是更開放的。比如說遷徙數(shù)據(jù),這個是大家都有的,遷徙數(shù)據(jù)390,676,這些距離大家都會挖掘數(shù)據(jù),其實也沒有評判的標(biāo)準(zhǔn),所以這里面就會有一個問題,大家的很多大數(shù)據(jù)沒有融合在一起,各自有各自的類型,我們后面可以憑著合作和開放的態(tài)度融合,大家可以找我說這些數(shù)據(jù)怎么用。

比如還有春節(jié)節(jié)點流量變化特點,這是我們分析了所有節(jié)點的流量,當(dāng)我之前沒有拿到這個分析結(jié)果時我是不知道具體的時間點,比如大家可以看到2月3號臘月十五流量是高峰,我沒有這個數(shù)據(jù)我是不知道2月3號臘月十五流量是高峰,但是可能是臘月二十八的時候是高峰,其實是不知道的。還有一個就是流量回升,初三的時候已經(jīng)回升,初七、初八是制高點,如果沒有這個大數(shù)據(jù)分析你是沒法精確到某一天的。

這是百度開放平臺,遷徙。baidu.com,這個是我截了百度7點早高峰,從四環(huán)、二環(huán)里面都會往國貿(mào)附近去跑,所以國貿(mào)附近在早上七點的時候就已經(jīng)開始非常擁堵了。

大家也可以看看北京出行紀律,北京是22千米,上海15千米,廣州21千米,我們可以看到北京22千米是一小時的時間,我們就可以給他選擇道路安排。還有同樣就是用戶畫像以及常住人口分析和流動人口分析,這些挖掘常駐身口工作地和居住地,以及行政區(qū)劃、商圈、小區(qū)等各個維度,這些都是可以數(shù)據(jù)持續(xù)更新,這些我們還做的不夠。百度有一個產(chǎn)品叫會選址,大家可能沒有用到,百度的合作商已經(jīng)用到“會選址”,比如當(dāng)你想開一家店,或者想要知道你投入的人流量的時候,按照你之前的一個估算店面會多大,需要多少員工,類似于此類的商業(yè)信息,但是在交通上面,其實由于百度是一群計算機的同學(xué)在做交通,所以在交通上面我們的應(yīng)用更多的是一些政府或或者說企業(yè)主動來找我們要一些數(shù)據(jù),我們不斷挖掘達到一些效果,所以數(shù)據(jù)挖掘方面我們是需要大家更多的指導(dǎo)的。以及旅游分析,這些我們跟鳳凰,和公園游樂場進行一些旅游市場分析,包括去哪兒,這些分析可以便于他們安排他們報什么價格,比如說它的客流是什么樣的情況,比如說它可以安排幾個點諸如此類的,比如這些個人性別、年齡和興趣愛好,這些我們都有,但是不一定用的特別好。如果大家有更好的想法和更好的應(yīng)用點的話,其實可以跟百度來合作。

還有景區(qū)熱力預(yù)警分析,這個就是剛剛所說的熱力圖,這個熱力圖實際上都是實時的,比如現(xiàn)在我們能拿到的北京朝陽公園的一個熱力圖,屬國朝陽公園發(fā)生了一些事件,比如說有些明星去朝陽公元駐唱之類的,有很多人,熱力圖會往那邊去,當(dāng)然這個百度和政府已經(jīng)合作了,我就不一一說。因為大家基于應(yīng)用,以及當(dāng)?shù)氐穆糜尉包c或者是當(dāng)?shù)仄嚽闆r。

最后我想跟大家分享最主要的一個目的是什么,其實互聯(lián)網(wǎng)在交通更專業(yè)的會議上面互聯(lián)網(wǎng)想說互聯(lián)網(wǎng)有哪些優(yōu)勢,互聯(lián)網(wǎng)有很多數(shù)據(jù),這些數(shù)據(jù)會覆蓋范圍非常廣,互聯(lián)網(wǎng)具有高效和通用性,如果我們在某個城市拿到很好的模型可以在全國馬上推廣使用。一個劣勢是什么,大家知道互聯(lián)網(wǎng)是更多的偏重數(shù)學(xué)和工程師,我們會基于統(tǒng)計辦法,我們不會拿傳統(tǒng)的交通模型,因為這些傳統(tǒng)的交通模型解決,平常是40分鐘大家覺得比較快了,如果到上海和深圳,40分鐘就會非常慢,因為我們沒有使用具體的場景,更多的使用通用的情況,我們可以通過通用的指數(shù)反應(yīng)各個不同的城市上面,雖然我們準(zhǔn)確反應(yīng)出速度,但是在速度上到底是擁堵還是暢通,各個城市不一樣。所以我們從這點看到互聯(lián)網(wǎng)企業(yè)并不是孤立的數(shù)據(jù)孤島,更多的是數(shù)據(jù)開放性的,而且包括它所有浮現(xiàn)出來的是所有大數(shù)據(jù)的冰山一角,這冰山一角需要大家更多的探討怎么使用,以及我們資源互換或者是融合,這就是我今天的分享,謝謝大家!

當(dāng)前標(biāo)題:百度地圖覃夢龍:大數(shù)據(jù)時代與智能交通
本文鏈接:http://www.muchs.cn/article0/chgsio.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站定制開發(fā)、Google、外貿(mào)建站、手機網(wǎng)站建設(shè)、軟件開發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)