【文件属性】:
文件名称:喜p:用于多标签文本分类的深度神经网络框架
文件大小:829KB
文件格式:ZIP
更新时间:2021-02-03 15:24:20
nlp machine-learning deep-learning neural-network word2vec
喜p是用于多标签文本分类的深度学习工具。 它在训练语料库上学习将标签分配给任意文本,并可用于预测未知数据上的标签。 它是由CERN开发的,用于将主题类别分配给高能物理摘要,并从中提取关键字。
简短介绍
>>> magpie = Magpie()
>>> magpie.init_word_vectors('/path/to/corpus', vec_dim=100)
>>> magpie.train('/path/to/corpus', ['label1', 'label2', 'label3'], epochs=3)
Training...
>>> magpie.predict_from_text('Well, that was quick!')
[('label1', 0.96), ('label3', 0.65), ('label2', 0.21)]
简短介绍
要训练模型,您需要有大量带标签的数据集,其文本格式编码为UTF-8。 可以在data / hep-categories目录下找到示例语料库。 .lab查找包含文本以进行预测的.txt文件,并在单独的行中分配标签的.lab