互聯(lián)網(wǎng)IDC圈8月31日報(bào)道,數(shù)據(jù)從何而來,這個(gè)問題看似簡單,卻是數(shù)據(jù)應(yīng)用最基礎(chǔ)的一步,正因?yàn)樾畔⒈〞r(shí)代產(chǎn)生的海量數(shù)據(jù)前提,我們才進(jìn)入了真正的大數(shù)據(jù)時(shí)代,《大數(shù)據(jù)時(shí)代》這本書是國外大數(shù)據(jù)研究的先河之作,本書的作者舍恩伯格被譽(yù)為大數(shù)據(jù)應(yīng)用第一人,在多個(gè)互聯(lián)網(wǎng)重鎮(zhèn)任教的經(jīng)理,早在2012年就在經(jīng)濟(jì)學(xué)人發(fā)布了14頁的大數(shù)據(jù)研究。8月29日-30日七牛D-Future數(shù)據(jù)時(shí)代峰會(huì)上維克托•邁爾•舍恩伯格讓我們再一次感受數(shù)據(jù)全新的洗禮。
創(chuàng)新互聯(lián)2013年至今,先為烏魯木齊等服務(wù)建站,烏魯木齊等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為烏魯木齊企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。維克托•邁爾•舍恩伯格
以下是舍恩伯格演講內(nèi)容(根據(jù)速記整理):
舍恩伯格:非常榮幸能出席今天的盛會(huì),今天上午我們聽到了很多技術(shù)的演講,技術(shù)實(shí)際上給我們帶來了變革,這些變革也給我們帶來了一些前所未有的成功,比如在商業(yè)界,還有各個(gè)公司,大公司小公司,給他們帶來了成功,在接下來的30分鐘,我想要讓大家思考一下,數(shù)據(jù)實(shí)際上給我們帶來了工具,這些工具給我們帶來了成功。但是我們真正取得成功,還是要取決于我們利用這個(gè)工具的能力。這就需要我們要好好的了解什么是數(shù)據(jù),還有未來的數(shù)據(jù)到底是怎么樣的。首先我給大家講一個(gè)故事吧。這個(gè)故事實(shí)際上是我的同事凱爾(音)所發(fā)現(xiàn)的一個(gè)非常有意思的故事。
大數(shù)據(jù)時(shí)代要改變傳統(tǒng)思維
好象出了一點(diǎn)技術(shù)問題,好象有一點(diǎn)變化,但是我還是我。我的朋友凱爾(音)跟我講了接下來的這樣一個(gè)小故事。在美國的超市,很多年前他們銷售這些蛋糕,這些蛋糕有不同的口味,巧克力蛋糕、香蕉蛋糕、桃子味的蛋糕,這個(gè)蛋糕的尺寸大概是30厘米那么大,就像一個(gè)餡餅一樣。如果你問一下這些美國的超市,他們銷售的這些蛋糕當(dāng)中,最受歡迎的銷量最好的,大家覺得在美國最受歡迎的是什么餡餅?zāi)??蘋果餡餅,是的。但是如果你要真正去問一下,他們是不是真的喜歡蘋果餡餅,實(shí)際上可能很多人并不是真的喜歡蘋果餡餅,他們?yōu)槭裁床皇亲钕矚g蘋果餡餅,卻買它呢?為什么呢?因?yàn)橄胍幌耄?0厘米那么大,那全家人呢?買一個(gè)蘋果派就夠了。那家里的所有人可以達(dá)成一致,他們起碼比較喜歡的就是蘋果派,比如像巧克力派、香蕉派、桃派,就是蘋果派不是他們最喜歡吃的,但是他們可以吃,這個(gè)可以達(dá)成共識。因此很多年以來,世界上的這些超市,賣的派可能未必是人們最喜歡的口味,之后他們發(fā)現(xiàn)了問題所在,就是尺寸問題。如果你讓它尺寸變小的話,也就是說,每一個(gè)家庭可以不止買一個(gè)派,每一個(gè)家庭成員都可以買一個(gè)自己喜歡吃的口味。如果你把尺寸變一下,他們可能就不是買蘋果派,可能他們根據(jù)自己的口味買香蕉派、梨派、桃派,這個(gè)問題就很簡單了。
因?yàn)樵谥?,很多年以來,這些超市的策略是不對的。實(shí)際上是尺寸的問題,而不是口味的問題,他們的尺寸太大了,之后他們進(jìn)行了調(diào)查,問用戶到底喜歡吃什么口味的,他們肯定喜歡說,我想要吃蘋果派,因?yàn)橹挥心莻€(gè)尺寸的蘋果派。大家可能說等一下,我們一直做研究數(shù)據(jù),我們一直看周圍的環(huán)境是什么樣的情況,是的,是這樣的。但是幾百年前幾千年前,我們看當(dāng)時(shí)的世界,觀察它,了解這個(gè)世界。那么在過去我們一直以來,都是這樣做的,我們一直也在搜集數(shù)據(jù)。搜集數(shù)據(jù),分析數(shù)據(jù),是需要花費(fèi)很多的時(shí)間,有時(shí)候也是非常困難的,需要做大量的工作,有時(shí)候也是非常昂貴的。我們有了幾千年的歷史,也在不停的搜集數(shù)據(jù),代價(jià)是非常昂貴的。但是我們可能用到的數(shù)據(jù)只有一小部分,有是有限的,我們花了那么多錢,搜集這個(gè)數(shù)據(jù),但是我們處理的量是很小的。因此我們之前擁有的數(shù)據(jù)規(guī)模是非常小的。每天我們所處理的數(shù)據(jù),實(shí)際上規(guī)模、數(shù)據(jù)是非常小的。大家可以想一下,我們現(xiàn)在的數(shù)據(jù)分析,或者是一些小的樣本。它們都是一些小的數(shù)據(jù)。我們是把數(shù)據(jù)縮小到一定的規(guī)模,然后從這些小的規(guī)模數(shù)據(jù)上找到一些理論。當(dāng)然了,那是小數(shù)據(jù)時(shí)代,也是我所成長的一個(gè)時(shí)代。
但是現(xiàn)在一切都變了。我們現(xiàn)在搜集數(shù)據(jù)分析數(shù)據(jù)的能力越來越強(qiáng)了。而且現(xiàn)在搜集數(shù)據(jù)的成本也下降了?,F(xiàn)在數(shù)據(jù)價(jià)格成本已經(jīng)不貴了。便宜了。因此我們周圍一切都變化了。那這時(shí)候我們就需要改變自己的思維,因?yàn)槲覀兯幍氖谴髷?shù)據(jù)時(shí)代。如果我們找到新的方法,就可以有新的理念。
隨時(shí)隨地的搜集數(shù)據(jù),在未來,可能它就起作用
在過去我們希望可以利用數(shù)據(jù),來回答問題,首先可能是先是假設(shè),這就是一個(gè)問題,然后搜集數(shù)據(jù),最后進(jìn)行分析,這就是一個(gè)流程。首先我們從問題切入。最后這個(gè)問題可能會(huì)給我們帶來這個(gè)答案。那么這個(gè)問題,比如說大家最喜歡的口味的派是什么,是蘋果還是桃味的?最后我們拿到了問題的答案,可能就是蘋果派,最后我們就覺得蘋果派是最受歡迎的,但是反而我們得到了這個(gè)問題的答案是錯(cuò)誤的。那么現(xiàn)在我們其實(shí)可以做一些改變,改變一下我們的方式,我們不是從問題開始著手,因?yàn)橛锌赡芪覀兊膯栴}本身就是錯(cuò)誤的。我們先從數(shù)據(jù)著手,然后從數(shù)據(jù)開始搜集數(shù)據(jù),進(jìn)行分析。然后通過分析,我們可以提出一些非常棒的問題。比如說這個(gè)派的尺寸,最合適的尺寸是什么,這是正確的問題。根據(jù)這個(gè)分析,我們可以獲得這樣的一個(gè)假設(shè)。最后我們可以得到問題的答案,就是我們需要一個(gè)尺寸合適大小合適的派。我給大家拍張照片,后面的兩位請微笑。好了,非常棒。現(xiàn)在我就要做一個(gè)決定,我拍了這個(gè)照片,什么是重要的,比如說如果你是非常重要的,我們就聚焦在你身上,后面的人就變成模糊的影像,我可能決定你是我的焦點(diǎn),我不能讓你成為一個(gè)模糊的影像?;蛘呤俏业慕裹c(diǎn)放在你這個(gè)人,那么你后面的人可能會(huì)變成模糊的影像,這意味著什么呢?我現(xiàn)在在照一個(gè)照片,我首先要清楚,我感興趣的事物是什么,人是什么。我的焦點(diǎn)在哪里,我需要知道這個(gè)問題,知道了這個(gè)問題之后,我才能知道答案。但是如果我現(xiàn)在不知道焦點(diǎn)聚集在誰身上,那怎么辦呢?實(shí)際上這個(gè)聚焦也是屬于小數(shù)據(jù),如果現(xiàn)在你現(xiàn)在已經(jīng)決定了你聚焦在誰身上,這個(gè)就是小數(shù)據(jù),如果現(xiàn)在還沒有決定那怎么辦呢?大家可以看這張照片,有一個(gè)牙刷,后面是我四歲的兒子,可以看到這里牙刷是我聚焦的位置,我兒子就變得模糊了。但是現(xiàn)在我想改變焦點(diǎn),讓我兒子成為焦點(diǎn),那怎么辦呢?那我們這張照片實(shí)際上是用大數(shù)據(jù)的攝象頭來設(shè)想的,它實(shí)際上可以捕捉到各種各樣的數(shù)據(jù),現(xiàn)在我們想要讓我的兒子變成焦點(diǎn),我用這個(gè)大數(shù)據(jù)攝像機(jī)拍完了之后,就可以調(diào)節(jié)這個(gè)焦點(diǎn),在牙刷和我兒子之間切換焦點(diǎn),因?yàn)檫@個(gè)攝像機(jī)搜集到了所有的數(shù)據(jù),不是小的數(shù)據(jù),而是大的數(shù)據(jù),因此我可以改變聚焦的位置。所以我們搜集所有的數(shù)據(jù),不需要先定義問題,可以先把數(shù)據(jù)搜集起來,再聚焦問題是什么。也就是說如果你可以搜集到全面的數(shù)據(jù)的話,可以發(fā)現(xiàn)創(chuàng)新性的問題。而且你可能完全不需要回答這些問題,大家可能聽說過這個(gè)品牌,多林國(音),實(shí)際上這是一個(gè)學(xué)習(xí)的應(yīng)用,你可以用Iphone或是安卓系統(tǒng)來學(xué)習(xí)外國的語言。非常有意思,而且很酷。如果有興趣的話,我也鼓勵(lì)大家使用這個(gè)應(yīng)用,全世界范圍內(nèi)有很多的人,每天都在使用多林國這個(gè)應(yīng)用。我們使用數(shù)碼設(shè)備,來使用這個(gè)應(yīng)用,這個(gè)應(yīng)用實(shí)際上可以捕捉我們的數(shù)據(jù),捕捉我們的信息,可以捕捉我們學(xué)習(xí)語言的習(xí)慣,而且進(jìn)行分析。多林國(音)這個(gè)公司,西班牙語的這些人,他們學(xué)習(xí)英語的方法是錯(cuò)誤的,他們學(xué)習(xí)順序是錯(cuò)誤的,如果你可以改變一下這個(gè)順序的話,西班牙人學(xué)習(xí)英語的速度就會(huì)越來越快。實(shí)際上他們一開始不是為了回答這個(gè)問題而搜集數(shù)據(jù),他們先是搜集數(shù)據(jù)之后,然后分析數(shù)據(jù),這個(gè)問題就出現(xiàn)了。他們通過分析,他們就調(diào)節(jié)了一下西班牙人學(xué)習(xí)英文的數(shù)據(jù),幫助他們更好的學(xué)習(xí)英文,因此取得了成功。大學(xué)為什么不用這種方法呢?為什么我的教授同事們沒有想到這一點(diǎn)呢?因?yàn)樗麄儧]有數(shù)據(jù),而多林國(音)公司搜集到了這些數(shù)據(jù)。多林國(音)一開始并不知道怎么使用這些數(shù)據(jù),但是他們逐漸逐漸的發(fā)現(xiàn)了可以如何應(yīng)用這些數(shù)據(jù),提升了用戶的體驗(yàn),也就是說,他們實(shí)際上可以實(shí)現(xiàn)很大的價(jià)值。他們不僅可以為客戶提供更好的價(jià)值,而且可以帶來利潤。在過去,在以前,我們首先是提出問題,然后開始搜集數(shù)據(jù),然后進(jìn)行分析,最后拿到答案,最后把數(shù)據(jù)給扔了,因?yàn)閿?shù)據(jù)已經(jīng)完成了任務(wù)了,所以就把它扔到了。你要存儲數(shù)據(jù)的話也是非常貴的,但是現(xiàn)在儲存數(shù)據(jù)是不貴的。現(xiàn)在你可以應(yīng)用數(shù)據(jù)實(shí)現(xiàn)更多的價(jià)值。你可以反復(fù)利用它,實(shí)現(xiàn)其他的目的。實(shí)際上我們看到的數(shù)據(jù)只是冰山一角而已。我們看到的是海洋之上的數(shù)據(jù),大部分的數(shù)據(jù)是隱藏在海洋之下的。如果你重復(fù)使用這些數(shù)據(jù),就可以發(fā)現(xiàn)潛在的價(jià)值。
文章標(biāo)題:YourData,YourFuture
網(wǎng)址分享:http://muchs.cn/article2/soiiic.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供域名注冊、全網(wǎng)營銷推廣、定制網(wǎng)站、標(biāo)簽優(yōu)化、網(wǎng)頁設(shè)計(jì)公司、服務(wù)器托管
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)