文件名称:PNAS-crowdsourcing-data
文件大小:3.21MB
文件格式:ZIP
更新时间:2024-03-29 23:28:26
JupyterNotebook
PNAS众包数据 这些数据文件用于支持论文“突发性危险评估的社会媒体数据”。 (李灵瑶,米歇尔·本西,马自慧,王禹和格雷戈里·贝歇尔)。 最近的三起灾害事件被用作该研究的基础:(1)2019年7月的里奇克莱斯特地震序列;(2)2019年4月的巴黎圣母院大火;以及(3)2019年7月的纽约市停电。 1. 2019年7月的里奇克莱斯特地震序列 Twitter搜索API的过滤词为“地震”,用于抓取2019年7月4日至7月10日与地震有关的数据。该词库暗示了损坏(例如,“损坏”,“伤害”,“破坏”和“开发了“ crack。”),并用于过滤与损害相关的推文。 用于损害分析的最终数据集包括51,043条推文,其中9,197条是原始推文。 假定描述损坏的原始推文很可能是第一手观察或报告,则删除了用于分析的转发。 2. 2019年4月的巴黎圣母院大火 已使用带有搜索短语“ Notre Dame”的Twi
【文件预览】:
PNAS-crowdsourcing-data-main
----NYC blackout data()
--------test.txt(1B)
----CA earthquake data()
--------3.false_filter_seeds.xlsx(35KB)
--------6.county_damage.xlsx(9KB)
--------10.embedding_lstm.ipynb(91KB)
--------8.ca_earthquake.twb(172KB)
--------2.damage_filter_seeds.docx(32KB)
--------1.tweet_data.xlsx(700KB)
--------9.tfidf_classifiers.ipynb(27KB)
--------README.md(1KB)
--------4.tweet_volume_words.xlsx(31KB)
--------5.damage_classification_result.xlsx(1.15MB)
--------11.classifiers_performance.docx(32KB)
--------7.MMI_intensity.xlsx(11KB)
----Notre Dame fire data()
--------2.sample_verification.xlsx(24KB)
--------4.temporal_data.xlsx(84KB)
--------1.tweet_data.xlsx(1016KB)
--------README.md(1B)
--------3.opinion_distribution.xlsx(40KB)
--------5.opinion_detection.ipynb(29KB)
----README.md(3KB)