文件名称:bhl_twarc_media
文件大小:3KB
文件格式:ZIP
更新时间:2024-03-02 21:41:47
Python
BHL TWARC媒体 对的补充脚本,用于从twarc爬网中捕获的URL下载tweet媒体。 要求 BHL TWARC媒体设置 克隆bhl_twarc_media.py 将bhl_twarc_media.py在同一目录bhl_twarc.py Twitter API设置 请注意,执行不需要消费者密钥,消费者密钥,访问令牌和访问令牌密钥。 利用 该脚本将仅与media目录中的内容进行交互 它解析每个提要的媒体文件夹中profile_images.csv和tweet_images.csv中的行 bhl_twarc将创建以下目录结构,并且此脚本将添加到media目录: feeds examplehashtag html json logs media profile_images tweet_images media_l
【文件预览】:
bhl_twarc_media-main
----README.md(2KB)
----bhl_twarc_media.py(9KB)