逐步回归法matlab代码-Data-Science-Portfolio:包含我为学术,自学和业余爱好而完成的数据科学项目组合的存储库。以iP

时间:2024-06-10 06:09:15
【文件属性】:

文件名称:逐步回归法matlab代码-Data-Science-Portfolio:包含我为学术,自学和业余爱好而完成的数据科学项目组合的存储库。以iP

文件大小:4KB

文件格式:ZIP

更新时间:2024-06-10 06:09:15

系统开源

初步回归法matlab代码凯文·文奈·卡森德拉 包含我为学术,自学和业余爱好而完成的数据科学项目组合的存储库。 以iPython Notebook和R文件的形式呈现。 *注意:项目中使用的数据(可在数据目录下访问)仅用于演示目的。 电子邮件: 领英 内容 项目: 机器学习 :使用前向神经网络和随机森林开发了一个优化程序,可根据信用历史数据(20个属性)对客户及其违约风险进行分类。 FNN中的神经元数量,配置和学习速率等参数会发生变化,而随机森林中的最大深度和树数则会发生变化。 我们使用交叉验证方法从NN和RF中找到最佳模型。 在验证集上,使用随机森林中的alpha = 0.3的配置(8,7)和使用tress = 100且最大深度= 10的配置(8,7)在NN中获得F-1分数为84.89%,在F-1分数为87.10%。 :有8种不同的电子书文本文件,可在上免费使用。 执行的步骤:将文本文件导入python,文本解析和转换操作(例如小写转换,去除特殊字符,收缩词,标记化等),为每个术语标记词性,将术语词干以获取其根词,停止词移动。 该项目还显示了未执行POS标记,停止单词删除和阻止操作时结


【文件预览】:
Data-Science-Portfolio-master
----LICENSE(1KB)
----README.md(7KB)

网友评论