喜p:用于多标签文本分类的深度神经网络框架

时间:2024-02-24 09:11:00
【文件属性】:

文件名称:喜p:用于多标签文本分类的深度神经网络框架

文件大小:829KB

文件格式:ZIP

更新时间:2024-02-24 09:11:00

nlp machine-learning deep-learning neural-network word2vec

喜p是用于多标签文本分类的深度学习工具。 它在训练语料库上学习将标签分配给任意文本,并可用于预测未知数据上的标签。 它是由CERN开发的,用于将主题类别分配给高能物理摘要,并从中提取关键字。 简短介绍 >>> magpie = Magpie() >>> magpie.init_word_vectors('/path/to/corpus', vec_dim=100) >>> magpie.train('/path/to/corpus', ['label1', 'label2', 'label3'], epochs=3) Training... >>> magpie.predict_from_text('Well, that was quick!') [('label1', 0.96), ('label3', 0.65), ('label2', 0.21)] 简短介绍 要训​​练模型,您需要有大量带标签的数据集,其文本格式编码为UTF-8。 可以在data / hep-categories目录下找到示例语料库。 .lab查找包含文本以进行预测的.txt文件,并在单独的行中分配标签的.lab


网友评论