wiki-table-scrape:从Wikipedia文章中将表格抓取到CSV文件中

时间:2024-06-15 10:46:21
【文件属性】:

文件名称:wiki-table-scrape:从Wikipedia文章中将表格抓取到CSV文件中

文件大小:37KB

文件格式:ZIP

更新时间:2024-06-15 10:46:21

Python

维基表格抓取 将Wikipedia页面上HTML表格抓取为CSV格式。 wikitablescrape可以用作Shell命令或作为Python包导入。 为什么? 使用此工具可以轻松地通过CLI以准备用于文本处理的格式下载任何Wikipedia表。 与类的工具结合使用时,这尤其有用。 最昂贵的大西洋飓风的年度分布 wikitablescrape --url='https://en.wikipedia.org/wiki/List_of_costliest_Atlantic_hurricanes' --header='costliest' | xsv select "Season" | xsv stats --median | xsv select field,min,max,median,mean,stddev | xsv table field min max medi


【文件预览】:
wiki-table-scrape-master
----setup.py(800B)
----.gitignore(1KB)
----requirements.txt(44B)
----requirements_dev.txt(72B)
----LICENSE(1KB)
----wikitablescrape()
--------parse.py(8KB)
--------__init__.py(0B)
--------cli.py(1KB)
--------__main__.py(61B)
--------test_parse.py(7KB)
----testdata()
--------wholepage()
--------colspan()
--------rowspan()
--------imgcells()
--------linebreaks()
--------mountains()
----.github()
--------workflows()
----scripts()
--------test.sh(474B)
--------wikitablescrape(67B)
--------release.sh(424B)
----README.md(5KB)

网友评论