SparkSQL基礎(chǔ)知識(shí)都有哪些-創(chuàng)新互聯(lián)

這篇文章給大家介紹SparkSQL基礎(chǔ)知識(shí)都有哪些,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。

十多年專注成都網(wǎng)站制作,企業(yè)網(wǎng)站建設(shè),個(gè)人網(wǎng)站制作服務(wù),為大家分享網(wǎng)站制作知識(shí)、方案,網(wǎng)站設(shè)計(jì)流程、步驟,成功服務(wù)上千家企業(yè)。為您提供網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)頁(yè)設(shè)計(jì)及定制高端網(wǎng)站建設(shè)服務(wù),專注于企業(yè)網(wǎng)站建設(shè),高端網(wǎng)頁(yè)制作,對(duì)成都VR全景等多個(gè)方面,擁有豐富的網(wǎng)站設(shè)計(jì)經(jīng)驗(yàn)。

一.SparkSQL架構(gòu)

1.架構(gòu)

SparkSQL基礎(chǔ)知識(shí)都有哪些

2.解釋

一個(gè)sql 過(guò)來(lái) 解析成unresolved,只拿出來(lái)字段名和表名
但是不知道字段名和表名在哪個(gè)位置
需要通過(guò)Schema 確定表的位置等信息,
生成邏輯執(zhí)行計(jì)劃,Logical,知道數(shù)據(jù)從哪里來(lái)了
通過(guò)一些列優(yōu)化過(guò)濾生成物理執(zhí)行計(jì)劃Physical
最后把物理執(zhí)行計(jì)劃放到spark集群上運(yùn)行

3.樣例

SparkSQL基礎(chǔ)知識(shí)都有哪些

二.SparkSQL的幾點(diǎn)誤區(qū)

Spark SQL就是寫(xiě)SQL,這是錯(cuò)誤的觀點(diǎn)
Spark SQL不是SQL,超出SQL,因?yàn)镾QL是其一部分
Spark SQL 是處理結(jié)構(gòu)化數(shù)據(jù)的,只是Spark中的一個(gè)模塊
Spark SQL 與 Hive on Spark  不是一個(gè)東西
Spark SQL 是spark里面的
Hive on Spark 的功能是比Spark SQL多的
Hive on Spark 穩(wěn)定性不是很好

三.SQL的幾個(gè)幾點(diǎn)注意

1.SQL注意

關(guān)系數(shù)據(jù)庫(kù)集群成本很高,還是有限的
SQL : schema + file
使用sql的前提就是有schema ,作用到文件上去
hive是進(jìn)程的
hive2.0 默認(rèn)引擎是Tez
Hive on Spark 就是把hive執(zhí)行引擎改成spark

2.執(zhí)行引擎

mr
spark
Tez

3.SparkSQL的JOIN

spark sql 可以跨數(shù)據(jù)源進(jìn)行join,例如hdfs與mysql里表內(nèi)容join
Spark SQL運(yùn)行可以不用hive,只要你連接到hive的metastore就可以

3.hive底層的hiveserver2協(xié)議走的是thrift

hiveserver2開(kāi)啟可以用JDBC或者ODBC直接連接

SparkSQL基礎(chǔ)知識(shí)都有哪些

四.連接Hive的幾種方式

1.三種方式

spark-sql 與 spark-shell  ,thriftserver
thriftserver對(duì)應(yīng)hive里面的hiveserver2

2.thriftserver連接方式

./beeline -u jdbc:hive2://localhost:10000 -n root

SparkSQL基礎(chǔ)知識(shí)都有哪些

3.thriftserver和spark-sql,spark-shell  的區(qū)別在哪?

spark-shell、spark-sql 都是是一個(gè)獨(dú)立的 spark application,
啟動(dòng)幾個(gè)就要幾個(gè)application,非常耗資源
用thriftserver,無(wú)論啟動(dòng)多少個(gè)客戶端(beeline)連接在一個(gè)thriftserver,
是一個(gè)獨(dú)立的spark application,
后面不用在重新申請(qǐng)資源。前一個(gè)beeline緩存的,下一個(gè)beeline也可以用
用thriftserver,可在ui看執(zhí)行計(jì)劃,優(yōu)化有優(yōu)勢(shì)

4.注意情況

這個(gè)要起來(lái),要不spark-shell, spark-sql,連接不上,這個(gè)跟hive一樣

SparkSQL基礎(chǔ)知識(shí)都有哪些

5.可能出錯(cuò)

spark-shell --master local[2] --jars /soft/hive/lib/mysql-connector-java-8.0.12.jar 這樣啟動(dòng)不起來(lái)
你可以試試把mysql-connector-java-8.0.12.jar 放到spark的jars里

SparkSQL基礎(chǔ)知識(shí)都有哪些

6.解決

SparkSQL基礎(chǔ)知識(shí)都有哪些

關(guān)于SparkSQL基礎(chǔ)知識(shí)都有哪些就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。

新聞名稱:SparkSQL基礎(chǔ)知識(shí)都有哪些-創(chuàng)新互聯(lián)
本文網(wǎng)址:http://muchs.cn/article4/dgidie.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供動(dòng)態(tài)網(wǎng)站企業(yè)建站、外貿(mào)網(wǎng)站建設(shè)定制網(wǎng)站、企業(yè)網(wǎng)站制作網(wǎng)站設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護(hù)公司