关于Hadoop ProxyUser的出现动机,参看
https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/Superusers.html
线上环境做了如下配置
<!--hadoop proxyuser-->
<property>
<name>hadoop.proxyuser.hdfs.groups</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hdfs.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.yarn.groups</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.yarn.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.mapred.groups</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.mapred.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hive.groups</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hive.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hbase.groups</name>
<value>*</value>
问题:
1. 首先对proxyuser做什么校验,比如该用户存储在LDAP或者数据中,但是Kerberos服务器授权配置的用户只有几个,比如hdfs,spark,hive,yarn,hbase,zookeeper等几个,这时就需要这些kerberos用户代理proxy user通过Kerberos授权检查
2. 由hdfs代理的proxy user访问hdfs时,是使用用户hdfs的权限还是proxy user自身的权限?