颜色分类leetcode-fastknn:用于大型数据集的快速k最近邻分类器

时间:2024-07-26 16:20:27
【文件属性】:

文件名称:颜色分类leetcode-fastknn:用于大型数据集的快速k最近邻分类器

文件大小:2.48MB

文件格式:ZIP

更新时间:2024-07-26 16:20:27

系统开源

颜色分类leetcode 快速KNN 具有收缩估计器的快速 k 最近邻分类器,用于类成员概率 为什么是fastknn ? fastknn现在可以在 . 看看这个,看看如何使用fastknn来提高你在Kaggle比赛中的表现的例子。 在几秒钟内构建具有大型数据集(> 100k 行)的 KNN 分类器。 使用"dist"估计器预测更多校准概率并减少对数损失。 根据各种损失函数找到最好的k参数,使用n折交叉验证。 为您的数据集绘制漂亮的分类决策边界。 进行特征工程并从数据集中提取信息量高的特征。 在Kaggle 中竞争。 试一试,让我知道你的想法! 快速最近邻搜索 fastknn方法基于库实现了 k-最近邻 (KNN) 分类器。 ANN 是用C++编写的,能够在O(N log N)时间内为给定数据集中的每个点找到 k 个最近邻。 该包提供了一个简单的界面来使用R ANN 库。 FastKNN 分类器 fastknn是为处理非常大的数据集(> 100k 行)而开发的,非常适合比赛。 对于大型数据集,它可以比R包中流行的knn方法快 50 倍。 此外, fastknn为类成员概率提供了一个收缩估


【文件预览】:
fastknn-master
----_pkgdown.yml(356B)
----fastknn_logo.png(47KB)
----vignettes()
--------knn-extraction.Rmd(5KB)
--------fastknn.Rmd(6KB)
----NAMESPACE(278B)
----README_files()
--------figure-markdown_github-ascii_identifiers()
----DESCRIPTION(1KB)
----fastknn_logo.svg(69KB)
----R()
--------extract.R(8KB)
--------sysdata.rda(1KB)
--------data.R(1KB)
--------decision.R(4KB)
--------knn.R(11KB)
--------zzz.R(313B)
--------loss.R(4KB)
--------utils.R(124B)
----.travis.yml(201B)
----.Rbuildignore(217B)
----fastknn.Rproj(343B)
----GPL-2.txt(18KB)
----README.md(23KB)
----Makefile(206B)
----data()
--------covertype.rda(550KB)
--------spirals.rda(31KB)
--------chess.rda(20KB)
--------multi_spirals.rda(31KB)
----man()
--------fastknnCV.Rd(2KB)
--------knnDecision.Rd(2KB)
--------spirals.Rd(581B)
--------knnExtract.Rd(3KB)
--------fastknn.Rd(3KB)
--------covertype.Rd(573B)
--------multi_spirals.Rd(615B)
--------classLoss.Rd(2KB)
--------chess.Rd(575B)
----docs()
--------index.html(44KB)
--------fastknn_logo.png(47KB)
--------reference()
--------pkgdown.js(140B)
--------pkgdown.css(2KB)
--------jquery.sticky-kit.min.js(3KB)
--------index_files()
--------link.svg(810B)
--------authors.html(3KB)
--------articles()
----appveyor.yml(860B)
----tests()
--------testthat()
--------testthat.R(337B)
----.gitignore(85B)
----README.Rmd(14KB)

网友评论