Koalas: Apache Spark上的Pandas API-python

时间:2024-07-08 12:12:55
【文件属性】:

文件名称:Koalas: Apache Spark上的Pandas API-python

文件大小:1.87MB

文件格式:ZIP

更新时间:2024-07-08 12:12:55

机器学习

Koalas: Apache Spark上的Pandas API Apache Spark 上的pandas API 探索Koalas 文档» 实时笔记本· 问题· 邮件列表 帮助被近期火灾摧毁的口渴考拉 Koalas 项目通过在Apache Spark 之上实施pandas DataFrame API,使数据科学家在与大数据交互时更加高效。 pandas 是 Python 中事实上的标准(单节点)DataFrame 实现,而 Spark 是大数据处理的事实上的标准。 使用此包,您可以: 如果您已经熟悉 Pandas,则无需学习曲线即可立即使用 Spark 提高效率。 拥有一个既适用于 Pandas(测试,较小的数据集)又适用于 Spark(分布式数据集)的代码库。 我们很乐意让您尝试并通过我们的邮件列表或 GitHub 问题向我们提供反馈。 在此处在实时 Jupyter 笔记本上试用 Koalas 10 分钟教程。 初始启动最多可能需要几分钟。 入门 Koalas 可以通过多种方式安装,例如 Conda 和 pip。 # Conda conda install koa


网友评论