文件名称:NeuralNLP-NeuralClassifier:开源神经分层多标签文本分类工具包
文件大小:34.81MB
文件格式:ZIP
更新时间:2024-05-21 01:52:01
Python
NeuralClassifier:开源神经分层多标签文本分类工具包 介绍 NeuralClassifier设计用于快速实现用于分层多标签分类任务的神经模型,这在实际情况下更具挑战性和普遍性。 一个突出的特点是NeuralClassifier当前提供了多种文本编码器,例如FastText,TextCNN,TextRNN,RCNN,VDCNN,DPCNN,DRNN,AttentiveConvNet和Transformer编码器等。它还支持其他文本分类方案,包括二进制类和多类分类。 它基于。 实验表明,在我们的工具包中构建的模型可实现与文献报道的结果相当的性能。 支持任务 二进制类文本分类 多类别文字分类 多标签文字分类 分层(多标签)文本分类(HMC) 支持文本编码器 TextCNN( ) RCNN( ) TextRNN( ) FastText( ) VDCNN( ) DP
【文件预览】:
NeuralNLP-NeuralClassifier-master
----eval.py(5KB)
----conf()
--------train.hierar.json(4KB)
--------train.json(4KB)
--------train.hmcn.json(4KB)
----data()
--------rcv1_merged.hierar.json(32.89MB)
--------rcv1_test.json(11.6MB)
--------rcv1.taxonomy(582B)
--------rcv1_test.hierar.json(11.59MB)
--------rcv1_dev.hierar.json(3.22MB)
--------rcv1_train.json(29.69MB)
--------rcv1_dev.json(3.23MB)
--------rcv1_train.hierar.json(29.66MB)
----model()
--------loss.py(7KB)
--------classification()
--------attention.py(4KB)
--------rnn.py(4KB)
--------transformer_encoder.py(4KB)
--------layers.py(7KB)
--------embedding.py(10KB)
--------optimizer.py(9KB)
--------model_util.py(6KB)
----train.py(11KB)
----predict.py(5KB)
----util.py(3KB)
----dataset()
--------dataset.py(15KB)
--------__init__.py(0B)
--------collator.py(10KB)
--------classification_dataset.py(7KB)
--------data_preprocessor.py(3KB)
----evaluate()
--------classification_evaluate.py(19KB)
----requirements.txt(33B)
----config.py(2KB)
----readme()
--------Configuration.md(6KB)
--------deeptext_arc.png(172KB)
--------logo.png(21KB)
----README.md(7KB)
----License_for_NeuralClassifier.TXT(32KB)