Hadoop权限管理

时间:2023-07-09 23:00:56
1.Hadoop权限管理包括以下几个模块:
(1) 用户分组管理。用于按组为单位组织管理,某个用户只能向固定分组中提交作业,只能使用固定分组中配置的资源;同时可以限制每个用户提交的作业数,使用的资源量等
(2) 作业管理。包括作业提交权限控制,作业运行状态查看权限控制等。如:可限定可提交作业的用户;可限定可查看作业运行状态的用户;可限定普通用户只能修改自己作业的优先级,kill自己的作业;高级用户可以控制所有作业等。
想要支持权限管理需使用Fair Scheduler或者 Capacity Scheduler(作业管理需用到Hadoop的ACL(Access Control List)功能,启用该功能需选择一个支持多队列管理的调度器)
2. 基本术语
(1)  用户(User):Hadoop使用Linux用户管理,Hadoop中的用户就是Linux中的用户
(2) 分组(group):Hadoop使用Linux分组管理,Hadoop中的分组就是Linux中的分组
(3) 池(pool):Hadoop Fair Scheduler中的概念,一个pool可以是一个user,一个group,或者一个queue。
(4) 队列(Queue):队列是Hadoop提出的概念,一个Queue可以由任意几个Group和任意几个User组成。
3.Linux下的文件类型如下:  - 普通文件  d 目录  l 链接文件  b 块设备  c 字符设备
rwxrwxrwx
三个三个一组看:
1. 第一段表示文件所有者对此文件的操作权限
2. 第二段表示文件所有者所在组对些文件的操作权限
3. 第三段表示除上述两种外的任何用户/组对此文件的操作权限

r读取:4
w写入:2
x执行:1

加起来就好了。
比如rwxrwxrwx是777
rwx------ 是700