這篇文章主要為大家展示了“Hive中如何實(shí)現(xiàn)分區(qū)表”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“Hive中如何實(shí)現(xiàn)分區(qū)表”這篇文章吧。
對(duì)于一張比較大的表,將其設(shè)計(jì)成分區(qū)表可以提升查詢的性能,對(duì)于一個(gè)特定分區(qū)的查詢,只會(huì)加載對(duì)應(yīng)分區(qū)路徑的文件數(shù)據(jù),因此,當(dāng)用戶使用特定分區(qū)列值執(zhí)行選擇查詢時(shí),將僅針對(duì)該特定分區(qū)執(zhí)行查詢,由于將針對(duì)較少的數(shù)據(jù)量進(jìn)行掃描,所以可以提供更好的性能。值得注意的是,分區(qū)字段的選擇是影響查詢性能的重要因素,盡量避免層級(jí)較深的分區(qū),這樣會(huì)造成太多的子文件夾。
現(xiàn)在問(wèn)題來(lái)了,該使用哪些列進(jìn)行分區(qū)呢?一條基本的法則是:選擇低基數(shù)屬性作為“分區(qū)鍵”,比如“地區(qū)”或“日期”等。
一些常見(jiàn)的分區(qū)字段可以是:
比如year、month、day或者h(yuǎn)our,當(dāng)表中存在時(shí)間或者日期字段時(shí),可以使用些字段。
比如國(guó)家、省份、城市等
比如部門(mén)、銷(xiāo)售區(qū)域、客戶等等
CREATE TABLE table_name (
col1 data_type,
col2 data_type)
PARTITIONED BY (partition1 data_type, partition2 data_type,….);
以上是“Hive中如何實(shí)現(xiàn)分區(qū)表”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道!
分享題目:Hive中如何實(shí)現(xiàn)分區(qū)表-創(chuàng)新互聯(lián)
網(wǎng)頁(yè)地址:http://muchs.cn/article2/iocic.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站、移動(dòng)網(wǎng)站建設(shè)、域名注冊(cè)、搜索引擎優(yōu)化、建站公司、品牌網(wǎng)站設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容