hadoop笔记1

编程语言 2018-05-12 11:20:19 阅读次数: 0

hdfs mapreduce简介

Hadoop组件

结构组成

Hadoop由2个主要的主件组成：hdfs,mapreduce

1) Hdfs

分布式文件系统，按照组成分为

masterNode: nameNode,JobTracker,SecondaryNameNode

slaveNode: DataNode,TaskTracker

nameNode:文件在各节点分块对应表。

SecondaryNameNode:文件分布快照，是NameNode的补充节点。

DataNode:数据的io操作。

taskTracker:各节点的操作监视节点

2) Mapreduce

设计为hdfs文件的计算组件。

分为：mapper

reducer

Mapreduce执行步骤

Mapper负责从hdfs文件系统读取信息，然后输出给reducer,reducer在输出到hdfs文件系统。

输入输出格式：

Map(k1,v1)àlist(k2,v2)

Reduce(k2,list(v2))-àlist(k3,v3)

Hdfs--àInput split--àmap--àcombiner--àshuffling---àreduce--àhdfs

其中shuffling中有分区的动作(partitioner)

Input split中包含了

文件分块：一个文件分割在一个机器节点上的多个块，或者不同机器节点上。

inputFormat: 文件分割到读取文件以什么格式给mapper.

TextInputFormat

KeyValueTextInputFormat

默认实现为FileInputFormat的子类，其中有2个方法

getSplits

getRecordReader此方法就是决定传什么样的值（RecordReader）给map方法。

Reduc后调用outputformat来写入文件

默认是textoutputformat

都是FileoutputFormat子类。

猜你喜欢

转载自turnround.iteye.com/blog/1976255

Hadoop1安装

面试--Hadoop1

大数据与Hadoop--1

hadoop01

hadoop-1 hive配置文档

hadoop1集群搭建

Hadoop 1.0.2 安装使用单机模式 Hadoop_1

Hadoop2 学习笔记（有部分Hadoop1内容）

Centos 7 搭建 Hadoop3.1教程

《Hadoop3.1》集群搭建指南

hadoop3.1高可用集群配置

: Name or service not knownstname hadoop001

hadoop_01集群搭建

hadoop1存在的问题及hadoop2的优势对比

Hadoop1和Hadoop2的区别

Hadoop1 与 Hadoop2 的架构异同

Name or service not knownstname hadoop11

学习总结篇——Hadoop01

hadoop1 常用端口和配置文件说明

远程调试hadoop1源码(以调试namenode举例)

hadoop1架构基本理解

Hadoop-01 hadoop简介安装配置测试

Hadoop生态系统架构以及Hadoop1和hadoop2的对比

Hadoop入门进阶步步高（六）-Hadoop1 x与Hadoop2的区别

Hadoop1和Hadoop2和Hadoop3之间的差异

Centos6.5/7 搭建hadoop3.1

Ubuntu16.04下Hadoop3.1的安装与配置

Linux上搭建伪集群 Hadoop3.1

hadoop3.1 分布式集群部署

Hadoop-1 Hadoop的三种运行模式和三个版本

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)