强烈建议你试试无所不能的chatGPT，快点击我

Spark应用(app jar)发布到Hadoop集群的过程

阅读量：6076 次

发布时间：2019-06-20

本文共 898 字，大约阅读时间需要 2 分钟。

记录了Spark，Hadoop集群的开启，关闭，以及Spark应用提交到Hadoop集群的过程，通过web端监控运行状态。

1.绝对路径开启集群

（每次集群重启，默认配置的hadoop集群中tmp文件被清空所以需要重新format)

我的集群安装位置是/opt/hadoop下，可以根据自己路径修改。

/opt/hadoop/bin/hdfs namenode -format

/opt/hadoop/sbin/start-all.sh/opt/spark/sbin/start-all.sh

使用jps命令查看集群是否全部正确开启

这里写图片描述

2.绝对路径关闭集群

/opt/hadoop/sbin/stop-all.sh/opt/spark/sbin/stop-all.sh

3.Spark业务(app)发布到Hadoop YARN集群方式

这里发布一个spark本身自带的jar发到hadoop集群中（此时hadoop和spark都已开启）

cd /opt/spark

./bin/spark-submit \--class org.apache.spark.examples.SparkPi \--master yarn \--deploy-mode cluster \--driver-memory 4g \--executor-memory 2g \--executor-cores 1 \lib/spark-examples-1.6.2-hadoop2.6.0.jar \10

注意spark-examples-1.6.2-hadoop2.6.0.jar，需要根据你的版本来看自带的版本号。

这里写图片描述

4.log地址(方便查看错误信息)

/opt/hadoop/logs/

/opt/spark/logs/

5.web地址查看（可以直观的查看集群执行情况）

通过看到执行成功SUCCEEDED

这里写图片描述

查看SparkPi运行结果，结果为Pi is roughly 3.140572。数值可能稍有不同。总之成功了！

这里写图片描述

这里写图片描述

转载于:https://www.cnblogs.com/lanzhi/p/6467675.html

你可能感兴趣的文章

Terratest：一个用于自动化基础设施测试的开源Go库

修改Windows远程终端默认端口,让服务器更安全

扩展器必须，SAS 2.0未必（SAS挺进中端存储系统之三）

Eclipse遇到Initializing Java Tooling解决办法

while((ch = getchar()) != '\n')

好程序员web前端分享JS检查浏览器类型和版本

Oracle DG 逻辑Standby数据同步性能优化

exchange 2010 队列删除

「翻译」逐步替换Sass

H5实现全屏与F11全屏

处理excel表的列

Excuse me？这个前端面试在搞事！

C#数据采集类

【BZOJ2019】nim

LINUX内核调试过程

【HDOJ】3553 Just a String

Java 集合深入理解（7）：ArrayList

2019年春季学期第四周作业

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-04 09:22:38 当前IP: 13.59.116.142 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我