文件名称:带有子词的上下文敏感词嵌入。 在锈。
文件大小:84KB
文件格式:ZIP
更新时间:2024-07-18 12:47:04
rust word embeddings structured skipgram
最终边界介绍finalfrontier 是一个用于训练词嵌入的 Rust 程序。finalfrontier 目前具有以下特点:楷模:skip-gram (Mikolov et al., 2013)结构化skip-gram (Ling et al., 2015)定向跳跃语法(Song et al., 2018)依赖性(Levy 和 Goldberg,2014 年)输出格式:最终融合快速文本word2vec 二进制word2vec 文本手套文字噪声对比估计(Gutmann 和 Hyvärinen,2012)子词表示(Bojanowski 等,2016)Hogwild SGD(Recht 等人,2011 年)通过finalfusion quantize命令量化嵌入。经过训练的嵌入可以存储在通用的finalfusion格式中,可以读取并与finalfusion crate 和finalfusion Python 模块一起使用。目前最低要求的 Rust 版本是 1.40。从这往哪儿走安装快速开始手册页:finalfrontier-skipgram(1) — 使用(结构化)skip-gram 模型
【文件预览】:
finalfrontier-master
----nix()
--------sources.json(1KB)
--------sources.nix(4KB)
----.gitignore(74B)
----benches()
--------dot_product.rs(2KB)
----LICENSE-2.0.txt(11KB)
----src()
--------deps.rs(17KB)
--------subcommands()
--------main.rs(2KB)
--------vocab()
--------idx.rs(3KB)
--------dep_trainer.rs(5KB)
--------vec_simd.rs(17KB)
--------train_model.rs(13KB)
--------io.rs(11KB)
--------sampling.rs(8KB)
--------util.rs(4KB)
--------config.rs(6KB)
--------hogwild.rs(4KB)
--------loss.rs(5KB)
--------skipgram_trainer.rs(7KB)
--------lib.rs(916B)
--------sgd.rs(7KB)
----LICENSE.md(2KB)
----default.nix(2KB)
----CONTRIBUTORS(544B)
----Cargo.lock(31KB)
----Cargo.toml(956B)
----testdata()
--------chunking.txt(52B)
--------dep_chunking.txt(55B)
----.github()
--------workflows()
----man()
--------finalfrontier.1(833B)
--------Makefile(126B)
--------finalfrontier-deps.1(8KB)
--------finalfrontier-skipgram.1(7KB)
--------finalfrontier-deps.1.md(7KB)
--------finalfrontier-skipgram.1.md(6KB)
--------finalfrontier.1.md(653B)
----README.md(2KB)
----.gitattributes(133B)
----docs()
--------INSTALL.md(912B)
--------QUICKSTART.md(585B)
----build.rs(635B)