文件名称:koalas:考拉
文件大小:1.86MB
文件格式:ZIP
更新时间:2024-04-09 02:59:19
data-science big-data spark pydata pandas
Apache Spark上的pandas API ·· 通过在Apache Spark之上实现pandas DataFrame API,Koalas项目使数据科学家在与大数据进行交互时更加高效。 pandas是Python中的事实标准(单节点)DataFrame实现,而Spark是大数据处理的事实标准。使用此软件包,您可以: 如果您已经熟悉熊猫,可以立即使用Spark进行工作,而无需学习。 有一个单一的代码库,可同时处理熊猫(测试,较小的数据集)和Spark(分布式数据集)。 我们很乐意让您尝试一下,并通过我们的或向我们提供反馈。 在的实时Jupyter笔记本上尝试考拉10分钟教程。首次启动可能需要花费几分钟。 入门 考拉可以通过多种方式安装,例如Conda和pip。 # Conda conda install koalas -c conda-forge # pip pip inst