文件名称:word-embedding-dimensionality-selection:词嵌入的维数
文件大小:29.91MB
文件格式:ZIP
更新时间:2024-05-02 21:21:34
Python
词嵌入维数选择 此仓库实现了词嵌入的维数选择过程。 在以下论文中,该过程是基于成对内部产品(PIP)损失的概念提出的。 不再选择300作为您的单词嵌入维数! 纸: 会议版本: : arXiv: : 幻灯片: : dl Neurips谈话的视频: : type theater @inproceedings{yin2018dimensionality, title={On the Dimensionality of Word Embedding}, author={Yin, Zi and Shen, Yuanyuan}, booktitle={Advances in Neural Information Processing Systems}, year={2018} } 和 @article{yin2018pairwise, title={Under
【文件预览】:
word-embedding-dimensionality-selection-master
----utils()
--------tokenizer.py(2KB)
--------reader.py(928B)
--------__init__.py(0B)
----matrix()
--------word2vec_matrix.py(2KB)
--------glove_matrix.py(2KB)
--------signal_matrix.py(2KB)
--------signal_matrix_factory.py(646B)
--------__init__.py(0B)
--------ppmi_lsa_matrix.py(2KB)
--------PIP_loss_calculator.py(5KB)
----main.py(2KB)
----requirements.txt(737B)
----config()
--------word2vec_sample_config.yml(309B)
--------glove_sample_config.yml(53B)
--------lsa_sample_config.yml(53B)
----LICENSE(1KB)
----test()
--------test_tokenizer.py(1KB)
--------__init__.py(0B)
----README.md(2KB)
----data()
--------text8.zip(29.89MB)
--------fake_data.txt(31B)
----.gitignore(6B)