文件名称:retriever:快速下载,清理公共数据集并将其安装到数据库管理系统中
文件大小:4.75MB
文件格式:ZIP
更新时间:2024-06-02 15:32:59
python data-science data dataset datasets
查找数据是一回事。 准备好进行分析是另一回事。 由于许多数据集缺少机器可读的元数据并且不符合已建立的数据结构和格式,因此获取,清理,标准化和导入公共可用数据非常耗时。 数据检索器通过下载,清理和标准化数据集并将其导入到关系数据库,平面文件或编程语言中,来自动化数据分析管道中的第一步。 此过程的自动化减少了用户花费数小时(有时甚至是数天)来启动和运行大型数据集的时间。 安装当前版本 如果您安装了Python,则可以使用以下任一pip来安装当前版本: pip install retriever 添加conda-forge通道( conda config --add channels conda-forge conda后,还是conda : conda install retriever 根据您的系统配置,这可能需要sudo的pip : sudo pip install retriever