文件名称:mongo-hadoop:适用于HadoopMongoDB连接器
文件大小:856KB
文件格式:ZIP
更新时间:2024-03-19 20:51:29
Java
MongoDB Hadoop连接器 目的 用于HadoopMongoDB连接器是一个库,该库允许将MongoDB(或数据格式为BSON的备份文件)用作Hadoop MapReduce任务的输入源或输出目标。 它旨在提供更大的灵活性和性能,并使MongoDB中的数据与Hadoop生态系统的其他部分轻松集成,包括以下内容: 请查看页面以获取最新的稳定发行版。 特征 可以创建数据拆分以读取独立配置,副本集或分片配置 可以使用MongoDB查询语言通过查询过滤源数据 支持Hadoop流,以允许以任何语言(当前支持python,ruby,nodejs)编写作业代码 可以从S3,HDFS或本地文件系统上驻留的MongoDB备份文件中读取数据 可以以.bson格式写出数据,然后可以使用mongorestore将其导入任何MongoDB数据库 与和等其他Hadoop工具中的BSON / MongoDB文档