文件名称:kpca_embeddings
文件大小:1.62MB
文件格式:ZIP
更新时间:2024-05-21 20:07:57
Python
kpca_embeddings Python实现 您可以训练KPCA嵌入来完成各种任务,例如从UCI Machine Learning Repository的或德语动词分类中对DNA序列进行结点识别。 确切的超参数组合可以在参考文件中找到。 我们还通过KPCA嵌入,参加了来自荷兰会议的荷兰语拼写纠正任务。 所提供的荷兰语拼写检查器的代码也包含在此存储库中。
【文件预览】:
kpca_embeddings-master
----paper.pdf(318KB)
----data()
--------nl_wordlist.txt(4.02MB)
--------freq_vocab_nl_3000.txt(22KB)
----LICENSE(11KB)
----src()
--------similarity.pyx(1KB)
--------NL_corrector.py(9KB)
--------KPCA_embeddings.py(8KB)
----README.md(1KB)