smart-data-lake:快速构建和维护智能数据湖的框架

时间:2024-05-02 07:49:37
【文件属性】:

文件名称:smart-data-lake:快速构建和维护智能数据湖的框架

文件大小:809KB

文件格式:ZIP

更新时间:2024-05-02 07:49:37

scala spark hive hadoop transform-data

智能数据湖 Smart Data Lake Builder是一个数据湖自动化框架,使加载和转换数据变得轻而易举。 它在Scala中实现,并建立在诸如和等开源大数据技术,包括用于各种数据源(HadoopFS,Hive,DeltaLake,JDBC,Splunk,Web服务,SFTP,JMS,Excel,Access)的连接器。和文件格式。 数据湖 是用于分析的*原始数据存储 促进廉价的原始存储来处理不断增长的数据量 为数据驱动型企业启用一流的人工智能(AI)和机器学习(ML)技术 Smart Data Lake添加了 一个分层的数据体系结构,不仅可以提供原始数据,还可以根据业务实体提供准备好的,安全的高质量数据,这些数据可随时用于分析用例,也称为“智能数据”。 这可与Databricks Lake House架构相媲美,实际上,Smart Data Lake Builder是在Datab


网友评论