HiAGM:用于层次文本分类的层次感知全局模型

时间:2024-06-13 16:11:37
【文件属性】:

文件名称:HiAGM:用于层次文本分类的层次感知全局模型

文件大小:251KB

文件格式:ZIP

更新时间:2024-06-13 16:11:37

text-classification hierarchical-classification graph-neural-networks Python

HiAGM:层次结构文本分类的层次结构感知全局模型 该存储库实现了层次结构感知的结构编码器,用于标签空间和文本特征之间的相互交互。 这项工作已被接受为ACL 2020中的长篇论文《的》。该存储库中提出了NYTimes(《纽约时报》)和WoS(Web of Science)的数据集拆分。 层次感知全局模型 具有层次结构意识的全局模型利用预先定义的层次结构的先验知识改进了常规文本分类模型。 项目文件夹由以下部分组成: config:配置文件(json格式) 数据:数据目录,可以在配置文件中更改(带有示例数据) data_modules:数据集/ DataLoader /整理器/ Vocab 助手:配置/ Hierarchy_Statistic /记录器/实用工具 模型:StructureModel / EmbeddingLayer / TextEncoder / TextPropaga


【文件预览】:
HiAGM-master
----data()
--------preprocess_nyt.py(5KB)
--------nyt_label.vocab(7KB)
--------sample_rcv1.taxonomy(250B)
--------rcv1_test.json(18KB)
--------rcv1_train.json(20KB)
--------rcv1.taxonomy(582B)
--------rcv1_prob.json(900B)
--------nyt.taxonomy(9KB)
--------rcv1_overall_corpus_train_prob.json(3KB)
--------idnewnyt_train.json(570KB)
--------idnewnyt_test.json(178KB)
--------preprocess_wos.py(11KB)
--------rcv1_val.json(13KB)
--------idnewnyt_val.json(142KB)
----train_modules()
--------trainer.py(5KB)
--------criterions.py(3KB)
--------evaluation_metrics.py(4KB)
----models()
--------multi_label_attention.py(3KB)
--------text_feature_propagation.py(2KB)
--------text_encoder.py(5KB)
--------origin.py(1KB)
--------embedding_layer.py(5KB)
--------structure_model()
--------model.py(4KB)
----LICENSE(1KB)
----helper()
--------configure.py(2KB)
--------utils.py(3KB)
--------hierarchy_tree_statistic.py(9KB)
--------logger.py(1KB)
----README.md(3KB)
----config()
--------rcv1-v2.json(2KB)
--------tree-rcv1-v2.json(2KB)
--------gcn-rcv1-v2-cpu.json(2KB)
--------gcn-rcv1-v2.json(2KB)
--------gcnla-rcv1-v2.json(2KB)
--------treela-rcv1-v2.json(2KB)
----evaluate.py(3KB)
----data_modules()
--------data_loader.py(2KB)
--------collator.py(2KB)
--------preprocess.py(5KB)
--------dataset.py(5KB)
--------vocab.py(6KB)
----train.py(7KB)

网友评论