文件名称:SGC:“简化图卷积网络”论文的正式实施
文件大小:5.45MB
文件格式:ZIP
更新时间:2024-02-23 20:19:54
machine-learning graph MachinelearningPython
简化图卷积网络 更新 正如#23所指出的,在reddit数据集的预处理代码中存在一个细微的错误。 修复此错误后,SGC的F1得分为95.0(以前是94.9)。 实用建议:标准化特征为零均值且标准差为1的值通常会非常有帮助,以加快SGC(和许多其他线性模型)的收敛。 例如,我们应用此规范化。 将SGC应用于其他数据集时,请考虑这样做。 有关一些相关的讨论,请参见以及。 作者: * * * *:平等贡献 总览 此存储库包含简单图卷积(SGC)模型的示例实现,在ICML2019论文《。 SGC消除了非线性并折叠了图卷积网络(GCN)中的权重矩阵,并且本质上是一个线性模型。 举例来说, SGC可以在保持竞争优势的同时节省大量培训时间。 作为参考,在GTX 1080 Ti上, 数据集 公制 训练时间 科拉 累计:81.0% 0.13秒 Citeseer 累计:71.9% 0.14秒 Pubmed 累计:78.9% 0.29秒 Reddit F1:94.9% 2.7秒 该家庭仓库包含引文网络(Cora,Citeseer和Pubmed)和社交网络(Reddit)的实现
【文件预览】:
SGC-master
----tuning.py(2KB)
----reddit.py(3KB)
----model.jpg(427KB)
----utils.py(5KB)
----SGC-tuning()
--------pubmed.txt(35B)
--------cora.txt(35B)
--------citeseer.txt(35B)
----requirements.txt(56B)
----downstream()
--------TextSGC()
----models.py(2KB)
----normalization.py(865B)
----LICENSE(1KB)
----metrics.py(482B)
----README.md(5KB)
----args.py(2KB)
----data()
--------ind.cora.allx(251KB)
--------ind.pubmed.tx(396KB)
--------ind.pubmed.allx(7.23MB)
--------ind.pubmed.y(854B)
--------ind.citeseer.ty(24KB)
--------ind.pubmed.test.index(6KB)
--------ind.cora.ty(27KB)
--------ind.pubmed.ally(219KB)
--------ind.cora.ally(47KB)
--------ind.pubmed.graph(461KB)
--------ind.citeseer.x(30KB)
--------ind.cora.y(4KB)
--------ind.citeseer.test.index(5KB)
--------ind.citeseer.ally(54KB)
--------ind.cora.tx(145KB)
--------ind.citeseer.allx(581KB)
--------ind.cora.test.index(5KB)
--------ind.citeseer.tx(254KB)
--------ind.citeseer.y(3KB)
--------ind.citeseer.graph(61KB)
--------ind.pubmed.ty(12KB)
--------ind.cora.graph(58KB)
--------ind.pubmed.x(23KB)
--------ind.cora.x(22KB)
----.gitignore(51B)
----citation.py(3KB)