Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建-創(chuàng)新互聯(lián)

這篇文章主要介紹“Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建”,在日常操作中,相信很多人在Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

10年積累的網(wǎng)站設(shè)計、成都做網(wǎng)站經(jīng)驗,可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認識你,你也不認識我。但先網(wǎng)站設(shè)計后付款的網(wǎng)站建設(shè)流程,更有西峽免費網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。

一、運行環(huán)境
CentOS 6.5
Spark 2.2.1
Hadoop 2.7.5
Java JDK 1.8
Scala 2.12.5

二、節(jié)點IP及角色對應(yīng)關(guān)系

節(jié)點名 IP Spark角色 hadoop角色
hyw-spark-1 10.39.60.221 master、worker master
hyw-spark-2
10.39.60.222 worker slave
hyw-spark-3 10.39.60.223 worker slave



三、基礎(chǔ)環(huán)境配置
undefined
undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined

四、jdk安裝(在hadoop用戶下執(zhí)行)
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined

五、scala安裝(在hadoop用戶下執(zhí)行)
undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined

六、hadoop集群安裝(在hadoop用戶下執(zhí)行)
undefined
undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined

undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined
undefined

  1. <configuration>

  2.    <property>

  3.         <name>fs.defaultFS</name>

  4.         <value>hdfs://hyw-spark-1:9000</value>

  5.     </property>

  6.     <property>

  7.         <name>hadoop.tmp.dir</name>

  8.         <value>file:/usr/local/hadoop/tmp</value>

  9.     </property>

  10. </configuration>

6.4.4、$vim hdfs-site.xml
將文件末尾修改為

  1. <configuration>

  2.     <property>

  3.         <name>dfs.replication</name>

  4.         <value>3</value>

  5.     </property>

  6. </configuration>

6.4.5、$vim mapred-site.xml
將文件末尾 修改為

  1. <configuration>

  2.     <property>

  3.         <name>mapreduce.framework.name</name>

  4.         <value>yarn</value>

  5.     </property>

  6. </configuration>



6.4.6、$vim yarn-site.xml
將文件末尾修改為

  1. <configuration>

  2. <!-- Site specific YARN configuration properties -->

  3.     <property>

  4.         <name>yarn.nodemanager.aux-services</name>

  5.         <value>mapreduce_shuffle</value>

  6.     </property>

  7.     <property>

  8.         <name>yarn.resourcemanager.hostname</name>

  9.         <value>hyw-spark-1</value>

  10.     </property>

  11. </configuration>

6.4.7、$vim slaves
添加如下內(nèi)容
hyw-spark-1
hyw-spark-2
hyw-spark-3
6.4.8、拷貝文件到slave節(jié)點(總共7個文件)
$scp hadoop-env.sh yarn-env.sh core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml slave hadoop@hyw-spark-2:/usr/local/spark/etc/spark/
$scp hadoop-env.sh yarn-env.sh core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml slave hadoop@hyw-spark-3:/usr/local/spark/etc/spark/

6.5、啟動hadoop集群
6.5.1、格式化NameNode
在Master節(jié)點上,執(zhí)行如下命令
$hdfs namenode -format
成功的話,會看到 “successfully formatted” 和 “Exitting with status 0” 的提示,若為 “Exitting with status 1” 則是出錯。
6.5.2、啟動HDFS(NameNode、DataNode)
在Master節(jié)點上,執(zhí)行如下命令
$start-dfs.sh
使用jps命令在Master上可以看到如下進程:
8757 SecondaryNameNode
7862 DataNode
7723 NameNode
8939 Jps
使用jps命令在兩個Slave上可以看到如下進程:
7556 Jps
7486 DataNode
6.5.3啟動Yarn(ResourceManager 、NodeManager)
在Master節(jié)點上,執(zhí)行如下命令
$start-yarn.sh
使用jps命令在Master上可以看到如下進程:
9410 Jps
8757 SecondaryNameNode
8997 ResourceManager
7862 DataNode
9112 NodeManager
7723 NameNode
使用jps命令在兩個Slave上可以看到如下進程:
7718 Jps
7607 NodeManager
7486 DataNode
6.5.4通過瀏覽器查看HDFS信息
瀏覽器訪問http://10.39.60.221:50070,出現(xiàn)如下界面
Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建

七、spark安裝(在hadoop用戶下執(zhí)行)
7.1、下載文件到/opt目錄下,解壓文件到/usr/local
$cd /opt
$sudo tar -xzvf spark-2.2.1-bin-hadoop2.7.tgz  -C /usr/local
$cd /usr/local
$sudo mv spark-2.2.1-bin-hadoop2.7/ spark
$sudo chown -R hadoop:hadoop spark

7.2、設(shè)置環(huán)境變量
$sudo vi /etc/profile
添加如下內(nèi)容
export SPARK_HOME=/usr/local/spark
PATH=$JAVA_HOME/bin:$PATH:$HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$SCALA_HOME/bin:$SPARK_HOME/bin:$SPARK_HOME/sbin
更新環(huán)境變量
source /etc/profile

7.3、配置文件修改
以下操作均在master節(jié)點配置,配置完成后scp到slave節(jié)點
$cd /usr/local/spark/conf
7.3.1、$cp spark-env.sh.template spark-env.sh
$vim spark-env.sh
添加如下內(nèi)容
export JAVA_HOME=/opt/jdk1.8
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop
export SCALA_HOME=/usr/local/scala
export SPARK_MASTER_IP=10.39.60.221
export SPARK_WORKER_MEMORY=1g
7.3.2、$cp slaves.template slaves
$vim slaves
添加如下內(nèi)容
hyw-spark-1
hyw-spark-2
hyw-spark-3
7.3.3拷貝文件到slave節(jié)點
$scp -r spark-env.sh slaves hadoop@hyw-spark-2:/usr/local/spark/conf/
$scp -r spark-env.sh slaves hadoop@hyw-spark-3:/usr/local/spark/conf/

7.4、啟動spark
7.4.1、啟動Master節(jié)點
Master節(jié)點上,執(zhí)行如下命令:
$start-master.sh
使用jps命令在master節(jié)點上可以看到如下進程:
10016 Jps
8757 SecondaryNameNode
8997 ResourceManager
7862 DataNode
9112 NodeManager
9832 Master
7723 NameNode
7.4.2、啟動worker節(jié)點
Master節(jié)點上,執(zhí)行如下命令:
$start-slaves.sh
使用jps命令在三個worker節(jié)點上可以看到如下進程:
7971 Worker
7486 DataNode
8030 Jps

7.5、通過瀏覽器查看spark信息
瀏覽器訪問http://10.39.60.221:8080,出現(xiàn)如下界面
Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建

到此,關(guān)于“Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建”的學習就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續(xù)學習更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>

標題名稱:Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建-創(chuàng)新互聯(lián)
分享路徑:http://muchs.cn/article44/dgdphe.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供全網(wǎng)營銷推廣、網(wǎng)站內(nèi)鏈、服務(wù)器托管、建站公司微信公眾號、網(wǎng)站設(shè)計

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務(wù)器托管