Hadoop全分布式搭建教程(CentOS7)
Hadoop全分布式搭建教程
1.HADOOP的下载
Hadoop3.3.6官方 下载地址
JDK8u221官方 下载地址
2.集群规划
主机名称 | 主机 IP地址 | 进程 |
---|---|---|
master | 192.168.xxx.101 | namenode、secondarynamenodde、resourcemanager |
slave1 | 192.168.xxx.102 | datanode、nodemanager |
slave2 | 192.168.xxx.103 | datanode、nodemanager |
3.安装虚拟机
(1)选择稍后安装操作系统
(2)操作系统选择Linux,版本选择CentOS 7 64位
(3)选择操作系统镜像
(4)设置安装位置
(5)手动配置分区
①添加swap分区,大小设置为物理内存大小的1-2倍;
②添加/boot分区,该分区用于引导操作系统启动,大小设置为512MB左右;
③添加/分区,该分区用作操作系统的文件系统,剩余空间都分配给根目录。
(6)配置虚拟机的网卡文件
①虚拟机的 网卡文件存放在/etc/sysconfig/network-scripts路径下,默认情况下该文件名称为ifcfg-ens33
1 | vi /etc/sysconfig/network-scripts/ifcfg-ens33 |
通过Vmware Workstation的虚拟网络编辑器查看虚拟网卡的IP网段
修改网卡配置文件
1 | 将 BOOTPROTO修改为static |
重启网卡
1 | systemctl restart network |
测试网络连通性
1 | ping www.163.com |
看到如下内容就说明,网卡配置好了。
(7)使用mobaxterm远程连接服务器
(8)创建工作目录
1 | mkdir /opt/data /opt/module /opt/software |
将jdk与hadoop的压缩包上传至/optsoftware
(9)关闭并禁用防火墙
1 | systemctl stop firewalld |
(10)修改主机名称与ip地址映射关系
1 | vi /etc/hosts |
(11)解压Hadoop与JDK
1 | tar -zxf jdk-8u221-linux-x64.tar.gz -C /opt/module |
(12)配置环境变量
1 | vi /etc/profile |
验证JDK与Hadoop是否安装成功
1 | java -version |
(13)克隆两台主机,并修改IP地址
分别修改slave1和slave2的IP地址
(14)修改主机名称
1 | # 分别三台主机执行 |
(15)配置免密登录
分别在三台主机执行以下步骤
1 | # 连续四次回车完成密钥生成 |
(16)配置Hadoop的配置文件
1 | cd $HADOOP_HOME/etc/hadoop |
①配置hadoop-env.sh
1 | vi hadoop-env.sh |
②配置core-site.xml
1 | #在<configuration></configuration>中添加以下内容 |
③配置hdfs-site.xml
1 | <configuration> |
④配置mapred-site.xml
1 | <configuration> |
⑤配置yarn-site.xml
1 | <configuration> |
⑥配置workers
1 | slave1 |
将配置文件分发至slave1与slave2
1 | scp -r $HADOOP_HOME/etc/hadoop root@slave1:/opt/module/hadoop-3.3.6/etc/ |
(17)格式化名称节点
1 | hdfs namenode -format |
看到图中successfully的提示信息就说明格式化成功了。
(18)启动集群
1 | # 群起群停 |
在master上能看到以下进程:
在slave节点上能看到以下进程:
至此Hadoop集群完全分布式搭建完毕!
(19)查看HDFS与YARN可视化界面:
1 | # 查看HDFS可视化界面 |
Hadoop全分布式搭建教程(CentOS7)
http://example.com/2025/10/20/Hadoop全分布式搭建教程-CentOS7/