（一）HDFS总体架构 - 代码天地

（一）HDFS总体架构

其他 2018-12-18 02:01:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qinshi965273101/article/details/82961345

1、背景

海量的非结构化数据，几乎没法梳理成一个个的字段，来存储在关系型数据库中。所以实际应用中，对于这类数据需要考虑数据如何存储。数据如何计算的问题。

2、hadoop两个核心

HDFS（以分布式方式来存储海量数据）
MapReduce（以HDFS上的数据为基础进行计算）

3、大数据特点

Volume（大量）
Velocity（持续高速增长）
Variety（多样性）
value（价值密度低，数据很多但真正有价值的数据少）
Veracity（真实性）

4、Hadoop版本

hadoop有第一代和第二代，第二代与第一代最显著的特点是：第二代比第一代多了一个资源调度框架（yarn）。

hadoop第二代上可以跑多种计算框架，例如spark，MapReduce等。

目前3.0版本已经发布。

5、HDFS架构

如图：

分布式存储数据：一个文件拆分成了四块，分别保存在机架1中的四台服务器中（datanode）
引入namenode：若要获取文件，需要知道该文件拆成哪些块，分别保存在哪等。namenode就是专门管理文件块信息。
避免namenode单点故障：有一个SecondaryNameNode服务作为namenode的备用。
引入副本冗余机制：此处采用三副本机制（磁盘利用率1/3），以黄色块为例，在机架1的第四台服务器上保本一个副本，在机架2的第一台服务器上保存了一个副本，以防机架1全部宕机。

namenode作用：

namenode数据在内存中，供客户端快速查询。为防数据丢失，也会在磁盘保存镜像文件。
管理整个分布式文件系统的元数据信息，一个文件多大，有几块，每个块多大，分别存储在那些节点等。
管理整个集群的状态，比如所有datanode时间间隔会向namenode发起一个心跳包，namenode时间间隔内没有收到心跳包，则判定为该datanode宕机。

1.0版本namenode单点故障解决方案：

SecondaryNameNode是1.0版本的方案
针对hdfs的操作，会有对应的操作记录。每时间间隔，SecondaryNameNode会把操作记录和当前镜像文件合并，生成最新的镜像文件。同时把数据同步给自己
SecondaryNameNode不是实时热备，可能会造成元数据的丢失。

2.0版本namenode单点故障解决方案

考虑到1.0版本的弊端，2.0版本提供实时热备，解决方案如下图
但是使用伪分布模式搭建hadoop，还是会使用SecondaryNameNode机制处理

猜你喜欢

转载自blog.csdn.net/qinshi965273101/article/details/82961345

（一）HDFS总体架构

HDFS 读写分离（总体架构介绍）

Tomcat架构解析(一)-----Tomcat总体架构

总体架构

python源码学习（一）——python的总体架构

jquery 1.7.2源码解析（一）总体架构

互联网架构（一）总体架构设计

HDFS架构——Hadoop入门(一)

VMware Vsphere 6.0安装部署（一）总体部署架构

基于Maven的SSM总体架构设计（一）

Framebuffer 驱动学习总结（一） ---- 总体架构及关键结构体

Lucene的总体架构

netty总体架构

jackRabbit总体架构

RocketMQ总体架构

平台总体技术架构

Tomcat总体架构演变

IFC总体架构

jquery总体架构

Dubbo的总体架构

Python总体架构

Dubbo的总体架构详解

Android Camera总体架构

ResourceManager总体架构

Mysql总体架构

canvas——场景的总体架构

集合框架总体架构

MySQL总体架构简述

spark 总体架构

lwip总体架构

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)