文件名称:DataAnalysis-DataScience:数据分析师项目
文件大小:11.63MB
文件格式:ZIP
更新时间:2024-04-25 23:15:25
JupyterNotebook
数据分析师/数据科学项目和工具 项目按主题文件夹进行组织。 My_tools文件夹包含我的通用函数,因此我可以在需要时使用它们。 涵盖的主题: 数据转换: :在此笔记本中,来自2020年马德里人口普查的数据与2016年平均收入和2020年社会服务数据交叉。 笔记本的目的是展示Pandas和Plotly库的工作: 进行分组(groupby) 数据框相交(合并) 数据转换(应用)和其他操作 情节(饼图,堆积条形图...) 相关性 分类,机器学习: :备忘单,此笔记本的基本代码参考为: 火车 调整超参数:(GridSearchCV,RandomSearchCV ...) 虚拟分类器 评估:(准确性,精确度,召回率,f1,报告,ROC AUC和具有最佳阈值的精确召回曲线) 可视化区域和数据 (即将进行的管道和交叉验证) 最大似然估计: :自己的数据实验,其中对高速公路上的
【文件预览】:
DataAnalysis-DataScience-main
----Rango_Edades_Seccion_202012.csv(16.09MB)
----servicios_sociales_urgencias_2020.csv(3.81MB)
----Astronomy()
--------Kepler()
----SWAPI()
--------Planet_population_distribution()
----LICENSE(34KB)
----Padron_Madrid()
--------Padron_Madrid.pdf(365KB)
--------infodistrito.csv(3KB)
--------padronByEdadDecanal.csv(3KB)
--------padronByEdadSimplif.csv(1KB)
--------Padron_Madrid.ipynb(4.02MB)
----Experiment_With_Exponential_and_Gamma_Distributions()
--------Real_experiment_counting_cars_Exponential_Gamma_MLikelihood_and_nonparametric_test.pdf(268KB)
--------Real_experiment_counting_cars_Exponential_Gamma_MLikelihood_and_nonparametric_test.ipynb(4.57MB)
--------timer.txt(11KB)
----README.md(3KB)
----My_tools()
--------Classification()
--------Maximum_likelihood_estimation()