文件名称:mlforhumans:人类机器学习
文件大小:8.83MB
文件格式:ZIP
更新时间:2024-06-20 05:35:18
JavaScript
用于人在环机器学习的可视化工具 团队成员 Marco Tulio Ribeiro 布莱恩·多汉斯基 概述 很多人盲目使用机器学习算法,只看汇总统计(即准确率)。 然而,很多时候模型会学习(人类认为是什么)不相关的信息,例如电子邮件地址或电子邮件语料库中的姓名。 这种类型的行为通常称为过度拟合,通常是不可取的,因为该模型不能推广到其他数据集。 实际上,我们希望模型学习对与分类任务相关的特征施加高权重。 例如,如果我们希望预测电子邮件是发布到Windows还是OS X列表中,则我们希望该模型对“ Microsoft”和“ Apple”等词给予较高的重视。 如果模型最初没有这样做,那么我们必须对模型或数据进行更改,以便模型可以应用于训练语料库之外的文档。 我们制作了一个交互式可视化,让用户更好地了解他们的算法实际在做什么。 我们已经包含了几个数据集作为示例,尽管该工具可以与其他文本语料库
【文件预览】:
mlforhumans-master
----report()
--------class_bin.png(12KB)
--------chi2009.cls(50KB)
--------statistics.png(19KB)
--------explain_pred.png(67KB)
--------feedback_loop_cropped.pdf(23KB)
--------feature_hover.png(39KB)
--------sample.bib(4KB)
--------likelihood_bin.png(14KB)
--------sample.tex(22KB)
--------feedback.png(71KB)
--------statistics_brush.png(10KB)
--------makepaper.sh(75B)
--------feature_importance.png(7KB)
----summary.png(106KB)
----old_storyboards.pdf(1.81MB)
----server.py(20KB)
----project_plan()
--------project_plan.pdf(86KB)
----README.md(3KB)
----fp_storyboard_1.pdf(1.28MB)
----template.tpl(6KB)
----bottle.py(145KB)
----static()
--------info_box.js(286B)
--------3ng.json(10.43MB)
--------lodash.js(397KB)
--------index.html(3KB)
--------d3.js(329KB)
--------example_histogram.js(9KB)
--------trip.min.css(24KB)
--------new.json(6.45MB)
--------d3.min.js(148KB)
--------code.js(69KB)
--------colors.js(113B)
--------trip.min.js(13KB)
--------style.css(16KB)
--------jquery-1.11.3.min.js(94KB)
----final()
--------final-report-marcotcr-bdol.pdf(313KB)
--------poster-marcotcr-bdol.pdf(1015KB)