1.hadoop广义狭义
Hadoop生态圈
2.hdfs哪三个进程
NN,DN,SNN
3.yarn哪两个进程
RM,NM
4.hdfs yarn默认web界面端口号
50070,8088
5.假如让你们改web界面端口号,请问怎么修改,去哪里找
看需要改那个Web界面的端口号,上官网查找文档,看那个配置文件管理端口号,再去机器上配置配置文件
例如yarn就在yarn-site.xml中
6.hdfs的NN是做什么的?
维护文件系统树
7.hdfs 副本放置策略 简述
就近原则
8.一个文件130M,副本数3,块大小设为128M,请问多少块,多少实际存储
空间要求
6个块,实际存储130*3=390M
9.面试题:hdfs读写流程
读:客户端发送请求->NN查询对应DN->DN返回数据
写:客户端发送请求->NN查询DN空间->DN直接获取数据->DN1复制到DN2复制到DN3
10.谈谈你对jps命令的理解( jps是哪里的命令,存储在哪,发现不可用怎么办)
查看JAVA进程,jps是jdk的命令
11.谈谈对pid文件的理解
pid是个临时文件,记录进程端口号
12.你会哪些hdfs常用命令
hadoop fs -put/-ls/-cat/-rm/-mkdir/-cpToLocal/-cpFromLocal.......
具体可以用hdfs dfs(hadoop fs)--help查看