文件名称:random_forests:在R&databricks社区中学习随机森林
文件大小:25KB
文件格式:ZIP
更新时间:2024-04-08 18:06:10
R
在R&databricks社区中学习随机森林 执行摘要 随机森林是一种机器学习方法,可补充决策树的缺点。根据2007年的随机森林在十大最受欢迎的机器学习算法中。随机森林通过平均多个决策树来提高性能。该算法具有2个有助于提高性能的功能。 套袋是第一个功能。随机森林基于许多决策树的平均预测来生成预测。如果树木随机不同,则此方法有效。 第二个功能是随机化构建树的变量。随机选择变量会减少森林中树木之间的相关性。 当研究人员使用随机森林时,一个可能的缺点可能是变量解释的损失。这是解决此已知问题的方法。随机森林通过计算单个树中使用变量的频率来区分变量的重要性。 该项目的目的是学习如何在多重和二进制分类模型中使用随机森林。该项目包括两个部分。在第一部分中,我们研究了模型调整参数和模型调整的不同方法。在第二部分中,我们制作了对汽车进行分类的数据产品。 TODO:决定用于数据产品的数据集 与我联系: 该项
【文件预览】:
random_forests-main
----ames_housing.R(3KB)
----readme.md(2KB)
----titanic_take_two.R(21KB)
----tune_regression.R(1KB)
----example_algorithms.R(9KB)
----tune_model.R(5KB)
----titanic_kenjee.R(22KB)
----tune_classifier.R(10KB)
----preprocess_data.R(7KB)