簡(jiǎn)析關(guān)于大數(shù)據(jù)的幾大流言

互聯(lián)網(wǎng)IDC圈4月28日?qǐng)?bào)道:據(jù)悉,IDC今年在數(shù)據(jù)存儲(chǔ)上的增長(zhǎng)速度將達(dá)到53.4%,無(wú)線數(shù)據(jù)的流量在過(guò)去的5年內(nèi)增長(zhǎng)200倍。如果你著眼自己通信渠道的話,將毫無(wú)疑問(wèn)的發(fā)現(xiàn)互聯(lián)網(wǎng)內(nèi)容、電子郵件、應(yīng)用通知、社交消息以及每天自動(dòng)接收的消息都在顯著的增長(zhǎng),這也是McKinsey、Facebook、Walmart都對(duì)大數(shù)據(jù)很重視的原因。

為門頭溝等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及門頭溝網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作、門頭溝網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!

隨著時(shí)代的發(fā)展,科技信息技術(shù)的發(fā)展也越來(lái)越成俗,而數(shù)據(jù)額體積和數(shù)據(jù)使用也在以驚人的速度增長(zhǎng),這一點(diǎn)從分析師的分析中不難獲得。Hadoop,這一神奇的開(kāi)源傳奇,在它的身旁也出現(xiàn)了不少流言蜚語(yǔ),而這言語(yǔ)可能會(huì)讓IT高管們帶著樂(lè)觀的心態(tài)去制定策略。

Hadoop是公司為了解決大數(shù)據(jù)需求的主要投資領(lǐng)域之一,而類似Facebook這些在大體積數(shù)據(jù)處理上有所建樹(shù)的公司都公開(kāi)的吹捧過(guò)在Hadoop上取得的成功,同樣初入大數(shù)據(jù)領(lǐng)域的公司也必先著眼這些成功的典型。通過(guò)Hadoop的炒作,我們可以避免功能固著這種認(rèn)知偏差。Hadoop是一個(gè)多維的解決方案,可以通過(guò)不同的方式進(jìn)行部署和使用。下面就看一下在開(kāi)始Hadoop項(xiàng)目之前必須了解的一些關(guān)于Hadoop和大數(shù)據(jù)的預(yù)先構(gòu)想的錯(cuò)誤理念:

傳統(tǒng)SQL不可以在Hadoop上使用

當(dāng)Facebook、Twitter、Yahoo!在Hadoop上豪賭時(shí),他們同樣知道HDFS和MapReduce受限于處理類似SQL語(yǔ)言的能力,這也是Hive、Pig和Sqoop最終得以孵化的原因。基于全球上大量的數(shù)據(jù)都是通過(guò)SQL來(lái)管理,一些公司和項(xiàng)目都在Hadoop和SQL的兼容上狠下功夫。

大數(shù)據(jù)只關(guān)系到體積

在體積之外,許多工業(yè)先鋒還經(jīng)常提到variety(多樣)、variability(可變)、velocity(速度)和value(價(jià)值)。撇開(kāi)所有單詞都押頭韻,關(guān)鍵點(diǎn)在于大數(shù)據(jù)并不是體積上的增長(zhǎng)——它正在向著實(shí)時(shí)分析、結(jié)構(gòu)化和非結(jié)構(gòu)化來(lái)源方向發(fā)展,并被用于嘗試和制定更好的決策。綜上所述,不是只有分析大體積數(shù)據(jù)才會(huì)獲得價(jià)值。

Hadoop只可以在數(shù)據(jù)中心運(yùn)行

首先,存在SaaS云服務(wù)解決方案。許多云服務(wù)允許你云端運(yùn)行Hadoop、SQL,這無(wú)疑可以幫助你省下數(shù)據(jù)中心建造投資的時(shí)間和金錢。對(duì)于一個(gè)公有云運(yùn)行時(shí),Java開(kāi)發(fā)者可以從SpringDataforHadoop以及一些其它的GitHub中的用例獲益。

取代大型機(jī)!Hadoop是唯一的新IT數(shù)據(jù)平臺(tái)

在IT投資組合里有很多一直長(zhǎng)期存在的投資,而大型機(jī)就是這么一個(gè)例子,與ERP、CRM和SCM這些系統(tǒng)一樣演變至今。而如果大型機(jī)不想被公司或者架構(gòu)遺棄,它就必須展示在現(xiàn)有投資環(huán)境中的價(jià)值。而VMware的許多客戶在使用大型機(jī)上都遇到了速度、規(guī)模和開(kāi)銷的問(wèn)題,但是并不是沒(méi)有途徑去解決這些問(wèn)題,比如像vFabricSQLFire這樣的內(nèi)存大數(shù)據(jù)網(wǎng)絡(luò)就可以被嵌入或者使用分布式緩存途徑去解決類似隊(duì)列的高速攝取、促進(jìn)大型機(jī)的批處理或?qū)崟r(shí)分析報(bào)告這些問(wèn)題。

Hadoop不可以在SAN或NAS上運(yùn)行

Hadoop在本地磁盤上運(yùn)行,對(duì)于中小型集群它同樣可以在一個(gè)共享的SAN環(huán)境下運(yùn)行良好。而高帶寬比如10GBEthernet、PoE以及iSCSI對(duì)性能同樣有很好的支持。

虛擬化會(huì)導(dǎo)致性能下降

Hadoop最初的設(shè)計(jì)只是在實(shí)體服務(wù)器上運(yùn)行,然而隨著越來(lái)越多機(jī)構(gòu)的采用,許多公司都希望它能作為數(shù)據(jù)中心服務(wù)在云中運(yùn)行。為什么這么多的公司都希望虛擬化Hadoop?首先要考慮管理基礎(chǔ)設(shè)施的擴(kuò)展性,VMware快速的認(rèn)識(shí)到擴(kuò)展計(jì)算資源,比如虛擬Hadoop節(jié)點(diǎn),當(dāng)數(shù)據(jù)和計(jì)算分開(kāi)時(shí)會(huì)對(duì)性能有所幫助,否則如果你關(guān)閉某個(gè)Hadoop節(jié)點(diǎn)將丟失上面的所有數(shù)據(jù)或者添加一個(gè)沒(méi)有數(shù)據(jù)的空節(jié)點(diǎn)。

Hadoop對(duì)虛擬化毫無(wú)經(jīng)濟(jì)價(jià)值

Hadoop通常解釋在一堆商用服務(wù)器上運(yùn)行,這樣就會(huì)有人認(rèn)為添加一個(gè)虛擬層在帶來(lái)額外支出的同時(shí)并不會(huì)有額外的價(jià)值收益。用這個(gè)觀點(diǎn)看是存在缺陷的,你并沒(méi)有考慮到數(shù)據(jù)和數(shù)據(jù)分析事實(shí)上都是動(dòng)態(tài)的。想成為一個(gè)利用Hadoop能量去成長(zhǎng)、創(chuàng)新及創(chuàng)造效率的公司,你必須改變數(shù)據(jù)的來(lái)源、分析的速度等等。虛擬化基礎(chǔ)設(shè)施同樣可以減少物理硬件的封裝,讓CAPEX直接等于純粹的商用硬件,而通過(guò)自動(dòng)以及更搞笑的利用共享基礎(chǔ)設(shè)施同樣可以減少OPEX.

那些肆意的宣傳只能是作為接受新事物的一個(gè)參考,這并不代表著抉擇,在你做決定之前進(jìn)行一些必要的了解和分析是非常重要的。而如果你受了這些漂亮謊言的蠱惑的話,將會(huì)讓你的投資陷入不符之地。

網(wǎng)站標(biāo)題:簡(jiǎn)析關(guān)于大數(shù)據(jù)的幾大流言
轉(zhuǎn)載注明:http://muchs.cn/article48/chgiep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、用戶體驗(yàn)、商城網(wǎng)站小程序開(kāi)發(fā)、全網(wǎng)營(yíng)銷推廣軟件開(kāi)發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都做網(wǎng)站