文件名称:justsemantics:词嵌入的助手(word2vec,glove)
文件大小:18KB
文件格式:ZIP
更新时间:2024-07-25 08:22:03
Java
只是语义:词嵌入向量的助手 免责声明:这个项目真的非常早,只有当你像我一样绝望时才应该使用它 它能做什么 它读取由 word2vec 或 GloVe 生成的矢量文件,然后使用 weka 的 kmeans 对它们进行聚类。 安装 现在 weka 是一个依赖项。 它不包含/打包,但应该很容易找到。 老实说,这不是一键式的情况。 无论如何,我提供了源代码,我相信你会知道该怎么做。 编写本文时,我使用了 weka 3.7.5 和 apache-commons cli 1.2。 你可能也应该这样做。 用法 源文件中包含一些善意的帮助选项。 他们可能会有所帮助。 输入输出 对于 word2vec,您只需要二进制向量文件和一些集群(k 表示 kMeans) 对于 GloVe,您将需要二进制向量文件、txt 格式的 vocab 文件和簇数(k 表示 kMeans) 它目前不写入输出文件,但会打印出集
【文件预览】:
justsemantics-master
----src()
--------semantictools()
----LICENSE(11KB)
----test()
--------semantictools()
----README.md(2KB)