前言
Hadoop
作为离线计算和分布式存储的基础, 至关重要. 虽然, 至如今, 分布式计算正在向Spark
上进行迁移, 但是Hadoop
中的分布式存储HDFS
及离线计算
仍然值得学习.
相关章节
部署&安装
Hadoop 安装(单结点)
Hadoop安装(YARN 集群)
HDFS
Hadoop Shell 命令 与 WordCount
Hadoop HDFS的Java API使用
Hadoop HDFS 基本原理(文件上传 & 文件下载 & NameNode & Secondary NameNode)
MR
Hadoop MR 之(一) 编写自己的WordCount
Hadoop MR 之(二) 传递自定义数据类型 & 排序
Hadoop MR 之(三) Combiner类 / Partitioner 类 / GroupingComparator 类
Hadoop MR 之(四) InputFormat 类 / OutputFormat类
Hadoop MR 之(五) 小文件的处理
Hadoop MR 之(六) Join操作 (MapJoin & ReduceJon & 缓存)
Hadoop MR 之(七) 其他基本操作
Hadoop MR 基本运维参数
Hadoop MR 核心原理
其他相关问题
-
慢结点问题.
Hadoop节点"慢磁盘"监控
大数据开发面试部分:Hadoop 如何应对某些节点运行较慢的问题
集群提交MapReduce作业执行卡住问题解决方案 -
MapTask
与ReduceTask
的指定问题.
hadoop中map和reduce的数量设置问题 -
多表
Join
问题(与Hive
内较为类似)
Hadoop 实现多个数据表的join操作 -
面试题
hadoop常见面试题
请查收:TOP 25大常见Hadoop面试题及答案
hadoop面试100道收集(带答案)
98道常见Hadoop面试题及答案解析