处理和分析数据

时间:2024-03-01 23:36:03
【文件属性】:

文件名称:处理和分析数据

文件大小:1.51MB

文件格式:ZIP

更新时间:2024-03-01 23:36:03

JupyterNotebook

缠绕和分析数据 目录 1项目概述-[ii我需要什么软件](#我需要什么软件?)[2数据](#the数据)[3关键点](#关键点) 介绍 实际数据很少干净。 使用Python及其库,我从各种来源收集了各种格式的数据,评估了其质量和整洁度,然后对其进行了清理。 我争论的数据集是Twitter用户@dog_rates的推文存档,也称为WeRateDogs。 WeRateDogs是一个Twitter帐户,通过对狗的幽默评论为人们的狗评分。 这些等级的分母几乎始终为10。但是,分子是多少? 几乎总是大于10。11 / 10、12 / 10、13 / 10等。为什么? 因为“他们是布伦特的好狗”。 WeRateDogs拥有超过400万关注者,并已获得国际媒体的报道。 该档案库包含2017年8月1日站立的所有5000+条推文的基本推文数据(推文ID,时间戳,文本等)。 我需要什么软件? 我使用Ju


【文件预览】:
wrangle-and-analyze-data-main
----wrangle_act.ipynb(591KB)
----twitter-archive-enhanced.csv(894KB)
----image-predictions.tsv(327KB)
----tweet_json.txt(10.05MB)
----wrangle_report.pdf(99KB)
----README.md(5KB)
----wrangle_act-checkpoint.ipynb(39KB)
----act_report.pdf(103KB)
----twitter_archive_master.csv(840KB)

网友评论