资源来自网络
1. 疫情更新的数据集,每24小时更新,但目前来看,好像更新不是很及时,可以不管
https://www.kaggle.com/imdevskp/corona-virus-report
表格内容:
Province/State Province/State
Country/Region Country/Region
Lat Latitude of the location
Long Longitude of the location
Date Date of cumulative report
Confirmed Cumulative number of confirmed cases till this day
Deaths Cumulative number of deaths till this day
Recovered Cumulative number of recovered cases till this day
2. 约翰·霍普金斯大学 公开的数据集,也是1的数据来源
https://github.com/CSSEGISandData/COVID-19
数据每日更新两次
来源:各大官方机构
https://github.com/AaronWard/covid-19-analysis
新冠疫情数据分析报告/可视化生成包(Python)
4. 一个可视化的例子
5. MIDAS 新冠肺炎疫情相关数据资源
https://github.com/midas-network/COVID-19
6. 一个丁香园相关数据的爬虫
2019新型冠状病毒疫情实时爬虫
https://github.com/BlankerL/DXY-COVID-19-Crawler
7. 可视化的例子 https://ncov.deepeye.tech/
数据源于6
8. 基于社交网络的流感爆发预测 这是一篇比较老的文章,思路可以借鉴一下
Forecasting the Flu: Designing Social Network Sensors for Epidemics
https://arxiv.org/pdf/1602.06866.pdf
9. 武汉新型冠状病毒防疫-数据科学项目
https://github.com/Glacier-Ice/Covid-19-data-science
10. 北京科技战疫 竞赛
https://www.datafountain.cn/special/BJSJ
每个赛题会提供相关的数据
算法类:
自然语言处理:疫情期间网民情绪识别
大数据分析:重点区域人群密度预测
多媒体内容分析:疫情期间互联网虚假新闻检测
文本分析:疫情政务问答助手
方案类:
数据挖掘:疫情对北京社会经济影响分析
创意创新:重大突发公共卫生事件处理解决方案
数据可视化:疫情数据可视化