文件名称:投资组合:数据科学投资组合
文件大小:1.22MB
文件格式:ZIP
更新时间:2024-03-14 23:29:47
JupyterNotebook
数据科学组合 包含数据科学和数据分析项目的存储库。 使用Python进行机器学习 解释性数据分析,特征工程,监督机器学习(逻辑回归,决策树,随机森林)。 结果:基准是Logistic回归,并且在测试数据集上产生了0.7694的AUC。 通过利用随机森林和对参数进行超调,可以达到0.8025 AUC。 因此,超调会产生更好的性能。 技术: 监督机器学习:逻辑回归,决策树,随机森林 工具 : Python :熊猫,Numpy,Sklearn,Matplotlib,Seaborn 带有Python的多层感知器 解释性数据分析,特征工程,MLP 结果:该项目的基准为0.7694。 MLP模型优于基准,但没有击败随机森林。 技术: 神经网络 工具 : Python :熊猫,Numpy,Sklearn,Matplotlib,Seaborn,Keras 使用R对高维数据进行多元分析
【文件预览】:
Portfolio-main
----images()
--------Correlation.PNG(66KB)
--------Express_Checkout_.PNG(122KB)
--------Parallel_Analysis_Scree_Plots.PNG(48KB)
--------Cluster_Dendorogram.PNG(25KB)
--------Express_Checkout_VS_One_Queue_One_Station.PNG(81KB)
--------aa(1B)
--------Express_Checkout.PNG(60KB)
--------RandomForest.PNG(54KB)
----_config.yml(25B)
----How to Identify Potential Cross-sell And Up-sell Customers.ipynb(1.01MB)
----modsim.py(36KB)
----.gitignore(40B)
----README.md(4KB)
----Express Checkout Simulation with Python .ipynb(109KB)
----MLP.ipynb(138KB)
----Data()
--------Hitters.csv(24KB)
--------europegroup.txt(2KB)
--------hi(1B)
--------psy_grades.txt(11KB)