MLlib-dropout:向 Apache Spark MLlib 项目添加 dropout 正则化的包

时间:2024-06-30 18:05:55
【文件属性】:

文件名称:MLlib-dropout:向 Apache Spark MLlib 项目添加 dropout 正则化的包

文件大小:16.05MB

文件格式:ZIP

更新时间:2024-06-30 18:05:55

Scala

MLlib - 带有 Dropout 的逻辑回归 这是 Spark MLlib 的扩展,使用 dropout 正则化实现逻辑回归。 Dropout 正则化通常比 L2 正则化效果更好,因为它强调在分类过程中很少出现但具有判别力的特征的贡献 [2]。 这使得它非常适合像 NLP 这样数据稀疏的应用。 话虽如此,当数据极其稀疏时,它实际上可能会起到不利作用,因为在已经稀疏的空间中删除某些特征可能根本不会为模型留下足够的信息来学习 [4]。 建造 这个 repo 是用 sbt 用 Scala 编写的,使用 Spark 1.3.0。 使用以下内容运行一个简单的示例。 sbt run-main dropout.example 要检查 NewsGroup-20 数据集 ( ) 的性能,请运行以下命令 sbt run-main dropout.news20 参考 斯里瓦斯塔瓦、尼蒂什等人


【文件预览】:
MLlib-dropout-master
----.gitignore(68B)
----README.md(2KB)
----build.sbt(553B)
----LICENSE(11KB)
----src()
--------main()

网友评论