Comparison-of-modin-and-pandas-df

时间:2024-04-19 22:26:05
【文件属性】:

文件名称:Comparison-of-modin-and-pandas-df

文件大小:4KB

文件格式:ZIP

更新时间:2024-04-19 22:26:05

JupyterNotebook

Modin和熊猫Df的比较 Pandas是一个图书馆,不需要在数据科学领域进行介绍。 它提供了高性能,易于使用的数据结构和数据分析工具。 但是,当处理大量数据时,单个核心上的熊猫就变得不够用,人们不得不求助于不同的分布式系统来提高其性能。 但是,为了提高性能而进行的权衡需要陡峭的学习曲线。 本质上,用户可能只希望Pandas运行得更快,而不希望针对其特定的硬件设置优化其工作流程。 这意味着人们希望为其10KB数据集使用与10TB数据集相同的Pandas脚本。 Modin提供了一种通过优化熊猫来提供解决方案的方法,以便数据科学家花时间从数据中提取价值,而不是花费在提取数据的工具上。 在该存储库中,我分析了kaggle钛酸数据集上的两个数据框,以查看它们在不同df操作下的性能


【文件预览】:
Comparison-of-modin-and-pandas-df-master
----Comparison of Modin and Pandas data frames.ipynb(16KB)
----README.md(1021B)

网友评论