文件名称:twarc-csv:Twarc CSV导出推文
文件大小:13KB
文件格式:ZIP
更新时间:2024-04-18 00:50:43
Python
twarc-csv 此模块将tweets的CSV导出添加到twarc 。 工作正在进行中。 要安装twarc和此插件: pip install twarc pip install twarc-csv #todo twarc中将提供一个新命令。 首先,使用以下方法展平数据: twarc flatten input.json one_json_per_line.jsonl 现在您可以转换为CSV twarc csv one_json_per_line.jsonl output.csv 当前,这期望每行有1条tweet json,这来自flatten命令。 在更高版本中,它将自动检测您提供的json格式,并采取适当措施。 CSV中的Twitter数据问题 CSV是存储Twitter数据的不佳选择。 始终保留原始API响应,并对json对象执行特征提取。 此导出脚本是为了方便起见,用于
【文件预览】:
twarc-csv-main
----test-data()
--------small_sample.csv(16KB)
--------small_sample.json(16KB)
----LICENSE(1KB)
----test_twarc_csv.py(68B)
----twarc_csv.py(2KB)
----setup.py(666B)
----.gitignore(2KB)
----README.md(1KB)