文件名称:阿里云javasdk源码-wiki:维基
文件大小:22.72MB
文件格式:ZIP
更新时间:2024-06-25 19:03:00
系统开源
阿里云java sdk源码 CDH集成Atlas 参考文档: 官方地址: 官方快速入门地址: 开发环境地址: admin/admin [TOC] 1.Atlas简介 Atlas是什么? Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心功能。 img Atlas支持各种Hadoop和非Hadoop元数据类型,提供了丰富的Rest Api进行集成,对数据血缘的追溯达到了字段级别,对权限也有很好的控制。 Atlas的架构原理: img Atlas的组件可以分为以下主要类别: Core Atlas核心包括以下组件: 类型系统:Atlas允许用户为他们要管理的元数据对象定义模型。该模型由称为“类型”的定义组成。称为“实体”的“类型”的实例表示受管理的实际元数据对象。类型系统是允许用户定义和管理类型和实体的组件。开箱即用的Atlas管理的所有元数据对象(例如,像Hive表)都使用类型进行建模,并表示为实体。为了在Atlas中存储新类型的元