博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
批量部署Hadoop集群环境(1)
阅读量:5794 次
发布时间:2019-06-18

本文共 2384 字,大约阅读时间需要 7 分钟。

批量部署Hadoop集群环境(1)

1. 项目简介:

  • 前言:云火的一塌糊涂,加上自大二就跟随一位教授做大数据项目,所以很早就产生了兴趣,随着知识的积累,虚拟机已经不能满足了,这次在服务器上以生产环境来部署Hadoop。已经搭建完毕,分享出来供大家参考。
  • 问题:看到Hadoop部署在一些资料上很是繁琐,一些简单的部署方法只是玩具,无法满足企业的部署条件,如果一台台服务器去部署,显然是不可行。
  • 解决:在学习及其他资料后,准备以《Apache Hadoop Yarn: Moving Beyond Mapreduce and Batch Processing with Apache Hadoop 2》为依据,其他资料辅助。
  • 注意:《Apache Hadoop Yarn: Moving Beyond Mapreduce and Batch Processing with Apache Hadoop 2》这本书有一处错误。
    • P53 原版“nm_host” 应改正为“nn_host”
    • 这么小的错误,影响是巨大的,我也是在实践本书内容时候,发现的错误,它会导致namenode不存在,而影响服务器节点无法启动。

2. 项目环境

  • 阿里云服务器ESC (4台)
  • Centos 7
  • Hadoop-YARN(2.7.1)
  • java version “1.8.0_72”
  • pdsh version “2.31”(批处理主要工具)
  • Xmanager Enterprise 5(使用xshell来连接服务器)

3. 服务器分配情况

集群节点名字 对应字段 主机编号 主机内网IP hostname
HDFS NameNode nn_host 00 10.251.20.244 iZ28z9sbsgjZ
YARN ResourceManager rm_host 00 10.251.20.244 iZ28z9sbsgjZ
HDFS SecondaryNameNode snn_host 01 10.45.202.245 iZ28fm2wvrwZ
MapReduce mr_history_host 02 10.144.27.164 iZ28n1kabs3Z
YARN网页代理服务器 yarn_proxy_host 03 10.163.97.250 iZ28bwz7umxZ
YARN NodeManager nm_hosts 01、02、03 10.45.202.245 10.144.27.164 10.163.97.250 iZ28fm2wvrwZ iZ28n1kabs3Z iZ28bwz7umxZ
HDFS DataNode dn_hosts 01、02、03 10.45.202.245 10.144.27.164 10.163.97.250 iZ28fm2wvrwZ iZ28n1kabs3Z iZ28bwz7umxZ

4. 项目目标

  • 实现批量部署Hadoop集群环境

5. 项目目录

6. 一键批量部署Hadoop环境,ESC服务器提前要准备的工作

7. 实现多台ESC内网连接

送上官方教程,图文声茂

8. 实现无密匙登录

有点小繁琐,但是原理很简单:

8.1每台机器需要生成密匙
生成密匙对

ssh-keygen -t rsa

8.2复制密匙到远程机器(固定机器/本机)

ssh-copy-id -i ~/.ssh/id_rsa.pub 10.x.x.x
  • 解析:
    ssh-keygen -t rsa 中,-t是type,模式是rsa
    ssh-copy-id -i ~/.ssh/id_rsa.pub 10.x.x.x 中,将本机id_rsa.pub复制到远程机器(如内网IP为10.x.x.x,替换为自己的一台固定服务器,这样,依次弄完后,这台“固定机器上边就有了所有机器的密匙”)

9. 修改host

目的是为了使用hostname可以ping通。

写入内网IP和hostname

vim /etc/hosts10.251.20.244 iZ28z9sbsgjZ10.45.202.245 iZ28fm2wvrwZ 10.144.27.164 iZ28n1kabs3Z10.163.97.250 iZ28bwz7umxZ

10. 实现pdsh访问

这次是以“固定机器”依次访问其他服务器(包括自己),如

访问自己

ssh iZ28z9sbsgjZ

访问完毕后,此时在~/.ssh生成known_hosts就包含了所有服务器

[root@iZ28z9sbsgjZ ~]# cd ~/.ssh[root@iZ28z9sbsgjZ .ssh]# lsauthorized_keys  id_rsa  id_rsa.pub  known_hosts

11. 开始批处理作业,以后的所有步骤很依赖pdsh,只要是批处理!

在opt文件下做如下操作(opt文件夹或者别的,建议默认,整篇教程都是这个路径)

11.1 创建all_hosts

cd /optvim all_hosts
#写入自己服务器hostname如:iZ28bwz7umxZiZ28fm2wvrwZiZ28n1kabs3ZiZ28z9sbsgjZ

11.2 批量复制固定机器(本机)的authorized_keys 和 known_hosts,到全部集群

pdcp -w ^all_hosts ~/.ssh/authorized_keys ~/.ssh/pdcp -w ^all_hosts ~/.ssh/known_hosts ~/.ssh/

这里写图片描述

12. 准备完毕,进入下一步 批量部署Hadoop集群环境(2)

转载于:https://www.cnblogs.com/lanzhi/p/6467746.html

你可能感兴趣的文章
SettingsNotePad++
查看>>
Kotlin入门简介
查看>>
leetcode:Symmetric Tree
查看>>
Android实现微博分享及其注意事项
查看>>
创建快照
查看>>
find命令应用exec及xargs
查看>>
安装Node.js
查看>>
基于二叉树和双向链表实现限制长度的最优Huffman编码
查看>>
LoadRunner使用入门 进行Webservice负载測试
查看>>
SVN中检出(check out) 和 导出(export) 的区别
查看>>
localtime死锁——多线程下fork子进程
查看>>
(转)Arcgis for Js之GeometryService实现测量距离和面积
查看>>
flex 通过htmlservices链接moss的rest(rest 的get post方式)
查看>>
maven入门(6)maven的生命周期
查看>>
python接口自动化9-https请求(SSL)
查看>>
掌握Chrome Developer Tools:下一阶段前端开发技术
查看>>
HttpModule的认识
查看>>
android studio下载地址
查看>>
数据的存在形式
查看>>
贝叶斯公式的共轭分布
查看>>