文件名称:epoxy:具有弱监督和预训练嵌入的交互式模型迭代
文件大小:5.73MB
文件格式:ZIP
更新时间:2024-05-13 23:16:46
Python
环氧树脂:具有弱监督和预训练嵌入的交互式模型迭代 更新07/20/20:代码现在支持使用FAISS进行快速和可扩展的NN搜索! 教程示例已更新,现在可以使用FAISS。 环氧树脂使用弱监督和预训练的嵌入来创建可以以编程交互速度(小于1/2秒)进行训练的模型,但是可以保留训练深度网络的性能。 该存储库为Epoxy提供了一个简单的概念验证实现(我们的实现约为100 LOC,包括文档字符串)。 在弱监督下,用户编写了嘈杂的标签功能,这些功能会为数据生成标签。 从历史上看,我们注意到这些标记功能通常具有很高的准确性,但覆盖率却很低(每个标记功能仅对点子集进行投票)。 弥补过去差距的唯一方法是编写更多的标签函数(当您开始处理长尾巴时可能会变得困难),或使用标签函数来训练最终模型(例如,参见更多细节)。 在Epoxy中,我们使用预训练的嵌入来获得训练最终模型的一些好处-无需训练一个。 我们使用嵌
【文件预览】:
epoxy-master
----figs()
--------figure_1_png.png(587KB)
----epoxy()
--------__init__.py(119B)
--------epoxy.py(12KB)
----LICENSE(11KB)
----examples()
--------data()
--------helpers.py(864B)
--------example_tutorial.ipynb(6KB)
----setup.py(444B)
----.gitignore(73B)
----README.md(3KB)