文件名称:machine_learning_projects::robot:机器学习项目
文件大小:6.27MB
文件格式:ZIP
更新时间:2024-04-03 19:26:18
machine-learning random-forest naive-bayes data-visualization web-scraping
机器学习项目 该存储库包含我在第一周完成的数据科学项目。 这些项目涵盖数据分析和可视化,功能工程,不同机器学习模型(随机森林,线性回归,决策树,朴素贝叶斯,ARIMA)的应用,超参数优化和正则化,自然语言处理和时间序列分析。 Gapminder-可视数据分析 数据: 目标:创建动画散点图 描述性统计,使用Matplotlib和Seaborn进行绘图 泰坦尼克号-分类项目 数据: 目标:应用机器学习模型预测泰坦尼克号上的乘客生存 探索泰坦尼克号数据集并建立基线模型 训练逻辑回归和随机森林分类模型 使用一键编码创建特征 计算训练和测试准确性以及交叉验证分数 出租自行车-回归模型 数据: 目标:通过回归模型预测租赁自行车的需求 使用Matplotlib和Seaborn进行探索性数据分析,探索时间序列数据 特征工程和特征选择 训练模型线性回归,随机森林回归 交叉验证 使用网格搜索优化模型
【文件预览】:
machine_learning_projects-master
----03_bikes()
--------bicycles_data_modelling.ipynb(123KB)
--------data()
--------random_forest_model.ipynb(16KB)
--------bicycles_data_analysis.ipynb(538KB)
----01_animated_scatterplot()
--------animated_scatterplot.ipynb(2.98MB)
--------data()
----05_temperature_time_series()
--------temperature_out_of_sample_prediction.ipynb(61KB)
--------probability_distribution.ipynb(19KB)
--------temperature_naive_forecast.ipynb(149KB)
--------temperature_linear_autoregression.ipynb(583KB)
--------data()
--------temperature_arima.ipynb(161KB)
--------temperature_base_prediction.ipynb(90KB)
--------temperature_decomposing.ipynb(622KB)
----04_lyrics_scraping()
--------data()
--------songs_scraping.ipynb(7KB)
--------lyrics_worldcloud.ipynb(378KB)
--------web_scraping_regex.ipynb(36KB)
--------lyrics_project.py(6KB)
--------lyrics_project.ipynb(72KB)
----.gitignore(2KB)
----README.md(3KB)
----02_titanic()
--------machine_learning_workflow.ipynb(18KB)
--------exploratory_data_analysis.ipynb(52KB)
--------data()
--------logistic_regression_model.ipynb(9KB)
--------different_ML_models_titanic.ipynb(20KB)
--------decision_tree_model.ipynb(262KB)
--------feature_engineering.ipynb(91KB)