【文件属性】:
文件名称:matlab精度检验代码-bonsai:提交论文的代码“盆景-用于极端多标签分类的多样和浅树”
文件大小:22.4MB
文件格式:ZIP
更新时间:2021-05-21 23:35:06
系统开源
matlab精度检验代码盆栽
C
++实现的论文
介绍
盆景-用于极端多标签分类的多样树和浅树
极端多标签分类(
XMC
)指的是分类器的监督学习,该分类器可以使用来自所有可能的目标标签的极大集合中的相关标签的子集自动标记实例。
盆景学习了多样性促进浅树的合奏,可以达到与最新的“一对一休息”方法同等的精确度,同时训练起来也要快得多。
盆景所造的树与帕拉贝尔所造的树在以下方面有所不同:
在每个节点上都有较大的扇出,即不是由Parabel进行标签的双向分割,而是通过Bonsai进行k分割。
(对于大多数实验,k设置为100)
允许在每个内部树节点上对标签进行不平衡分区,从而产生与数据相关的分区。
较浅,即树中的级别数少得多。
编译与测试
Bonsai的代码是用C
++编写的,因此需要启用C
++
11的编译器。
要进行编译,请从shallow目录中运行make命令
shallow目录内提供了一个示例脚本sample_run.sh该脚本用于训练模型并计算EUR-Lex数据集的指标。
可以通过上述sample_run.sh脚本将Bonsai用于其他数据集,方法是将较小的数据集(如EUR-Lex
【文件预览】:
bonsai-master
----sandbox()
--------convert_data.sh(520B)
--------label_append_train.py(701B)
--------data()
----tools()
--------metrics()
--------c++()
--------matlab()
--------convert_format.pl(766B)
----liblinear_COPYRIGHT(1KB)
----LICENSE(1KB)
----outputs()
--------eurlex()
--------wiki10()
--------wikiLSHTC()
----shallow()
--------helpers.h(324B)
--------bonsai_train.cpp(3KB)
--------bonsai.h(7KB)
--------bonsai.cpp(38KB)
--------bonsai_predict.cpp(3KB)
--------helpers.cpp(932B)
--------Makefile(531B)
--------sample_run.sh(2KB)
----.gitignore(3KB)
----README.md(2KB)
----scripts()
--------wiki10_cmds.txt(1KB)
--------depth_exp.sh(2KB)
--------gen_depth_exp_cmds.py(605B)
--------gen_tree_json.py(4KB)
--------wikipedia500k_cmds.txt(2KB)
--------eurlex_cmds.txt(1KB)
--------agg_depth_exp.py(2KB)
--------sbatch.sh(329B)
--------gen_depth_exp_cmds.sh(369B)
--------wikiLSHTC_cmds.txt(321B)