哈希嵌入:哈希嵌入的PyTorch实施(NIPS 2017)。 提交NIPS实施挑战

时间:2024-02-24 12:22:44
【文件属性】:

文件名称:哈希嵌入:哈希嵌入的PyTorch实施(NIPS 2017)。 提交NIPS实施挑战

文件大小:700KB

文件格式:ZIP

更新时间:2024-02-24 12:22:44

nlp hashing reproducible-research word-embeddings pytorch

散列嵌入 PyTorch实现了版本的(NIPS 2017)。 提交NIPS实施挑战赛( )。 此目录有两个用途: 在PyTorch中实现改进的哈希嵌入层。 可以在./hashembed文件夹中找到。 它适用于Python 2和3。 在PyTorch中实现一条简单的流水线,以评估新的NLP分类算法/新的嵌入类型。 可以在./evaluate文件夹中找到。 这仅在python 3上进行了测试。 散列嵌入是散列技巧的一般化,目的是在相同数量的参数下获得更大的词汇量,换句话说,它可以用于使用较少参数来近似散列技巧。 哈希技巧(在NLP上下文中)是一种流行的技术,您使用哈希表而不是字典来嵌入单词


【文件预览】:
Hash-Embeddings-master
----models()
--------.keep(0B)
----images()
--------embeddings_explanation.png(562KB)
--------accuracy_distribution_dbpedia_embeddings.png(37KB)
--------equation_collision.png(3KB)
--------accuracy_distribution_ag_hyperparameter.png(39KB)
--------p_collision_new.png(3KB)
--------accuracy_distribution_ag_embeddings.png(39KB)
--------p_collision_old.png(3KB)
----evaluate()
--------main.py(16KB)
--------__init__.py(0B)
--------pipeline()
--------load()
----requirements.txt(72B)
----LICENSE(1KB)
----hashembed()
--------__init__.py(45B)
--------embedding.py(12KB)
----README.md(22KB)
----results.txt(4KB)
----.gitignore(338B)
----bin()
--------no_dict_all.sh(620B)
--------accuracy_distribution_param.sh(1KB)
--------accuracy_distribution.sh(1001B)
--------dict_all.sh(991B)

网友评论