bytehub:ByteHub:使功能存储变得简单

时间:2024-03-06 19:56:05
【文件属性】:

文件名称:bytehub:ByteHub:使功能存储变得简单

文件大小:32KB

文件格式:ZIP

更新时间:2024-03-06 19:56:05

data-science machine-learning pandas data-engineering dask

字节集线器 易于使用的功能存储。 :floppy_disk: 什么是功能库? 功能存储是用于数据科学和机器学习的数据存储系统。 它可以存储原始数据,还可以存储已转换的特征,可以直接将其输入到ML模型或训练脚本中。 功能存储通过将数据流组织到模型中,可以使数据科学家和工程师提高生产力。 区旨在: 使用简单,并具有类似Pandas的API; 不需要在本地Python安装或云环境中运行的复杂基础架构; 针对时间序列操作进行了优化,使其非常适合金融,能源,预测等应用; 和 支持简单的时间/值数据以及复杂的结构,例如字典。 它基于构建,以支持大型数据集和集群计算环境。 :owl: 特征 可搜索的功能信息和元数据可以使用SQLite本地存储或存储在远程数据库中。 时间序列数据使用Dask以保存,从而可以从其他工具中读取。 数据可以驻留在本地文件系统上,也可以驻留在(例如AWS S3)中。 支持时间序列联接,以


【文件预览】:
bytehub-master
----environment.yml(212B)
----.github()
--------workflows()
----tests()
--------test_featurestore.py(23KB)
----LICENSE(34KB)
----requirements.txt(62B)
----setup.py(835B)
----.gitignore(66B)
----bytehub()
--------utils.py(351B)
--------__init__.py(66B)
--------store.py(21KB)
--------model.py(19KB)
--------_version.py(22B)
--------_connection.py(568B)
----README.md(4KB)
----.bumpversion.cfg(103B)
----.pre-commit-config.yaml(232B)

网友评论