【文件属性】:
文件名称:acamica-DS:Acámica的数据科学课程项目
文件大小:7.75MB
文件格式:ZIP
更新时间:2021-04-10 10:29:35
JupyterNotebook
1个触及率
在此存储库中,我将上传在2020/2021年由Acámica教授的数据科学课程中交付的项目(组25)
2.主题
模块1:数据科学导论
话题:
编程(类和函数)
Python和Numpy,Pandas,Matplotlib,Seaborn等库
探索性数据分析(EDA)
机器学习入门:分类和回归
图表类型
基本模型(树,KNN,线性回归,逻辑回归)
评估指标
MAE
训练/测试拆分
项目:第一个机器学习模型(已批准) )
在此项目中,我首先对包含阿根廷的属性数据的数据集执行了EDA。 在确定其特殊性之后,我训练了一个简单的机器学习模型并对其超参数进行了优化,以根据给定属性预测潜在新属性的价格。 由于缺乏适当的预处理和模型的简单性,模型的精度不能令人满意。
模块2:高级工具
话题:
深度机器学习
统计基础
模型的解释-统计:分布,贝叶斯定理
先进模型:装配体,SVM,朴
【文件预览】:
acamica-DS-master
----DSProyecto02.ipynb(1.72MB)
----DS_Proyecto_04_NLP-Informe_final.ipynb(4.78MB)
----DS_Proyecto_03_NLP.ipynb(4.63MB)
----DSProyecto01.ipynb(1.42MB)
----README.md(4KB)