Hadoop發(fā)生了什么？我們該如何做？

2021-02-09 分類：網(wǎng)站建設(shè)

Apache Hadoop出現(xiàn)在IT領(lǐng)域是在2006年，它可以支持使用廉價的商用硬件來存儲海量數(shù)據(jù)。從某種意義上來說，Hadoop幫助我們迎來了大數(shù)據(jù)時代。希望越高，期待也越大。企業(yè)可以在稱之為數(shù)據(jù)湖的基于Hadoop的存儲中存儲盡可能多的數(shù)據(jù)，并進行后續(xù)的分析。這些數(shù)據(jù)湖伴隨著一系列的獨立的開源計算引擎，并且基于此開源即意味著免費。那么會可能出現(xiàn)什么錯誤?

Monte Zweben，Splice Machine的CEO，對Hadoop將要發(fā)生的事情有一個有趣的看法，特別是對其垮臺背后的三個主要原因：

模式讀是一個錯誤

首先，所謂Hadoop的好功能竟是它的致命缺點。隨著寫模式限制的解除，TB級的數(shù)據(jù)結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)寫入到數(shù)據(jù)湖中。由于Hadoop的數(shù)據(jù)治理框架和功能仍在設(shè)計，企業(yè)越來越難以確定其數(shù)據(jù)的血緣關(guān)系，導(dǎo)致它們對自己的數(shù)據(jù)失去信任，數(shù)據(jù)湖變成了數(shù)據(jù)沼澤。

Hadoop的復(fù)雜性和管道式的計算引擎

其次，Hadoop發(fā)行版中提供了一些列的開源計算引擎，例如Apache Hive，Apache Spark，Apache Kafka。這些計算引擎操作起來很復(fù)雜，需要專門的技術(shù)才能把這些技術(shù)串聯(lián)起來，但比較困難。

錯誤的焦點 - 數(shù)據(jù)湖與應(yīng)用程序

第三點也是最重要一點，數(shù)據(jù)湖項目開始失敗,因為Hadoop集群往往成為企業(yè)數(shù)據(jù)流管道(過濾，處理，傳輸)的gateway，然后數(shù)據(jù)會轉(zhuǎn)出到數(shù)據(jù)庫和數(shù)據(jù)集市用于下游匯報，并且?guī)缀鯊奈丛谄髽I(yè)中找到真正的業(yè)務(wù)應(yīng)用程序。結(jié)果，數(shù)據(jù)湖最終成為一組龐大的不同計算引擎，在不同的工作負(fù)載上運行，所有這些引擎共享相同的存儲。這些很難進行管理。生態(tài)系統(tǒng)中的資源隔離和管理工具正在不斷完善，但仍有很長的路要走。企業(yè)無法將注意力從使用數(shù)據(jù)湖作為廉價的數(shù)據(jù)存儲庫轉(zhuǎn)移到使用數(shù)據(jù)和支持關(guān)鍵任務(wù)應(yīng)用程序的平臺。

許多組織都關(guān)注Hadoop生態(tài)系統(tǒng)的最新發(fā)展，并承受著展示數(shù)據(jù)湖價值的壓力。對于企業(yè)來說，至關(guān)重要的是確定如何在Hadoop失敗后成功地實現(xiàn)應(yīng)用程序的現(xiàn)代化，以及實現(xiàn)這一目標(biāo)的好策略。Hadoop曾經(jīng)是最被炒作的技術(shù)，如今屬于人工智能。當(dāng)心炒作周期，有一天你可能不得不為它的影響負(fù)責(zé)。

本文題目：Hadoop發(fā)生了什么？我們該如何做？
標(biāo)題URL：http://muchs.cn/news/99968.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供小程序開發(fā)、網(wǎng)站建設(shè)、動態(tài)網(wǎng)站、網(wǎng)站設(shè)計、虛擬主機、響應(yīng)式網(wǎng)站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

為什么新手做電商難開單？ 2021-02-09
網(wǎng)站服務(wù)器是選用云主機還是虛擬空間？ 2021-02-09
網(wǎng)頁設(shè)計北京企業(yè)建設(shè)公司 2021-02-09
如何確保您家中的物聯(lián)網(wǎng)網(wǎng)絡(luò)正常運行和安全？ 2021-02-09
中文域名申請能否快速得到市場認(rèn)可 2021-02-09
微信電商如今發(fā)展的怎么樣了？ 2021-02-09
全球十大域名排行榜最常用的域名都在這里，你了解哪些呢 2021-02-09

Hadoop發(fā)生了什么？我們該如何做？

Hadoop發(fā)生了什么？我們該如何做？