文件名称:nmi指数matlab代码-NeuralSinkhornTopicModel:通过最优传输的神经主题模型,ICLR2021
文件大小:19.6MB
文件格式:ZIP
更新时间:2024-07-09 12:38:16
系统开源
nmi指数matlab代码通过最优传输的神经主题模型 这个 repo 包含 ICLR 论文 [1] 的 Tensorflow 实现。 要求 代码在 Tensorflow 1.0 上运行,应该很容易适应 Tensorflow 2.0。 需求在requirements.txt文件中。 请使用 numpy==1.19.5 或更低版本以避免与 Tensorflow 1.15 不兼容。 数据 我们所提供的文件,包括20News,WS和TMN中使用的数据集的预处理版本的文件夹下datasets 。 每个数据集都存储在具有以下内容的 MAT 文件中: wordsTrain:V一定的用于与词汇表中的V字Ñ火车训练文档Ñ列车计数矩阵 wordsTest:V一定的N个测试计数矩阵为N个测试测试文件 labelTrain:训练文档的标签索引 labelTest:测试文档的标签索引 labelToGroup:标签的名称 词汇:词汇中的词 嵌入:为词汇表中的单词预训练的 50 维 GloVe 词嵌入 请按照上述格式准备自己的文件。 如果你想使用这个数据集,请引用我们论文中引用的原始论文。 运行 NSTM 只需p
【文件预览】:
NeuralSinkhornTopicModel-master
----nstm.py(6KB)
----utils.py(6KB)
----LICENSE(1KB)
----requirements.txt(1KB)
----.gitignore(11B)
----evaluation()
--------ClusteringEval.java(7KB)
--------ClusteringEval.class(4KB)
--------compute_topic_diversity.m(255B)
--------compute_purity_nmi_kmeans.m(555B)
--------compute_purity_nmi_top.m(308B)
--------evaluate.m(392B)
----README.md(2KB)
----auto_diff_sinkhorn.py(2KB)
----datasets()
--------20News()
--------TMN()
--------Webs()