黑马程序员-大数据入门到实战-MapReduce & YARN入门

编程语言 2023-07-18 17:55:09 阅读次数: 0

文章目录

1. 分布式计算概述
2. MapReduce概述
3. YARN概述
4. YARN架构
- 4.1 核心架构
- 4.2 辅助架构
5. MapReduce & YARN的部署
6. MapReduce & YARN初体验
- 6.1 集群启停命令
- 6.2 提交MapReduce任务到YARN执行

1. 分布式计算概述

计算与分布式计算

计算：对数据进行处理，使用统计分析等手段得到需要的结果
分布式计算：多台服务器协同工作，共同完成一个计算任务

分布式计算的两种工作模式

分散→汇总（MapReduce）
中心调度→步骤执行（Spark、Flink）

2. MapReduce概述

MapReduce

Hadoop中分布式计算组件
分散→汇总模式

主要接口

map接口：“分散”功能
reduce接口：“汇总”功能

运行机制

将执行的需求分解为多个 Map Task 和 Reduce Task
将 Map Task 和 Reduce Task 分配到对应的服务器去执行

3. YARN概述

YARN

Hadoop一个组件
用于集群的资源调度

MapReduce与YARN的关系

YARN用来调度资源给MapReduce分配和管理运行资源
MapReduce需要YARN才能执行

4. YARN架构

4.1 核心架构

核心架构角色

主：ResourceManager
从：NodeManager

功能

ResourceManager：管理、统筹并分配整个集群的资源
NodeManager：管理、分配单个服务器的资源，即创建管理容器，由容器提供资源供程序使用

4.2 辅助架构

ProxyServer：保障web UI访问的安全性
JobHistoryServer：记录历史程序运行信息和日志

5. MapReduce & YARN的部署

5.1 集群规划

node1：ResourceManager、NodeManager、ProxyServer、JobHistoryServer
node2：NodeManager
node3：NodeManager

5.2 MapReduce配置文件

在 $HADOOP_HOME/etc/hadoop文件夹内，修改：

mapred-env.sh文件
mapred-site.xml文件
yarn-env.sh文件
yarn-site.xml文件

5.3 分发配置文件

5.4 集群启动命令介绍

一键启动YARN集群：$HADOOP_HOME/sbin/start-yarn.sh
一键停止YARN集群：
$HADOOP_HOME/sbin/stop-yarn.sh

5.5 开启YARN集群

在node1服务器，以hadoop用户执行

start-yarn.sh
mapred --daemon start historyserver

查看YARN的运行

http://node1:8088

6. MapReduce & YARN初体验

6.1 集群启停命令

启动

start-yarn.sh
mapred --daemon start historyserver

停止

stop-yarn.sh
mapred --daemon stop historyserver

6.2 提交MapReduce任务到YARN执行

略

猜你喜欢

转载自blog.csdn.net/m0_68111267/article/details/131736590

黑马程序员-大数据入门到实战-MapReduce & YARN入门

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门

黑马程序员-大数据入门到实战-HDFS分布式存储

黑马程序员-大数据入门到实战-前置章节

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念

Yarn 入门

【大数据入门二——yarn和mapreduce】

YARN的入门介绍

Yarn集群入门学习

Yarn基础入门

Uni-App从入门到实战-黑马程序员【uniapp基础知识讲义笔记】

[黑马程序员Redis入门到实战教程]——基础篇

关于YARN（Hadoop入门三）

Apache Hadoop Yarn 入门（一）

yarn详细入门教程

黑马程序员——java基础入门

Spark on Yarn ｜ Spark，从入门到精通

Yarn快速入门系列(2)——Yarn的运行流程

Yarn快速系列入门(4) | Yarn调度器

程序员入门必备的大数据开发实战系列丛书

好程序员大数据视频教程从零基础入门到精通

2019大数据入门到精通：资深程序员规划让你熟知学习路线

黑马程序员_PHP从入门到精通【视频教程】

【C++】黑马程序员《C++从入门到精通》

大数据入门（14）hadoop+yarn+zookeeper集群搭建

【大数据入门实践】Yarn伪分布式部署

Yarn 构建工具入门基础

Hadoop入门之Yarn调度MR流程

yarn详细入门教程(转载)

yarn详细入门级教程

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)