BoxOfficeMojo-Data:将 BoxOfficeMojo 类表转换为 Pandas DataFrame 对象以进行分析的解析实用程序

时间:2024-06-25 11:53:52
【文件属性】:

文件名称:BoxOfficeMojo-Data:将 BoxOfficeMojo 类表转换为 Pandas DataFrame 对象以进行分析的解析实用程序

文件大小:5KB

文件格式:ZIP

更新时间:2024-06-25 11:53:52

data-analysis dataset-creation Python

关于 BoxOfficeMojo -数据是用于从转换表BoxOfficeMojo状或来源的网页,以一组函数pandas数据帧的对象。 如果您之前来过这里并且对这个项目发生了多少变化感到困惑,这个存储库曾经包含一组脚本,用于从 BoxOfficeMojo 上非常特定的页面(所有这些都列在“流派”下)中抓取非常特定的数据。 像所有的脚本,但是,它需要的甚至微小偏差巨大改变其用途,对于该数据的最终期望的形式很多assummptions,成为了一系列不容易阅读单片文件,一般不设计好. 这是对 BoxOfficeMojo-Data 进行改进以更好地满足人们需求的尝试。 如果您对使用此存储库的原始版本感兴趣,它仍然在这里 - 只需跳转到此存储库中名为“original”的分支,然后从那里拉取即可。 注意事项 此工具仅解析与 BoxOfficeMojo 网页对应的静态 HTML 文档,并将其转换为更


【文件预览】:
BoxOfficeMojo-Data-master
----utilities.py(744B)
----scraper.py(3KB)
----README.md(6KB)

网友评论