Text-Classification-with-3-key-NLP-techniques:使用关键的NLP技术将新闻文章分类

时间:2024-05-02 13:47:09
【文件属性】:

文件名称:Text-Classification-with-3-key-NLP-techniques:使用关键的NLP技术将新闻文章分类

文件大小:25.39MB

文件格式:ZIP

更新时间:2024-05-02 13:47:09

tensorflow nlp-machine-learning embeddings-word2vec classification-model bert-model

使用3键NLP技术进行文本分类 使用Key NLP技术将新闻文章分类为以下类别:Bag_of_Words(tf-Idf),单词嵌入和BERT语言模型 原始项目和工作已在发表在《科学》杂志上。 修改了有关BERT语言建模部分的代码。 其余部分来自本文的原始作者。 可以在Kaggle的找到使用的数据集。 该数据集包含从HuffPost获得的大约20万条2012年至2018年的新闻头条。 每个新闻标题都有对应的类别(政治,娱乐,科学等)。 共有30个类别。


【文件预览】:
Text-Classification-with-3-key-NLP-techniques-main
----Text_classification_with_3_different_NLP_techniques.ipynb(2.79MB)
----README.md(814B)
----News_Category_Dataset_v2.json.gz(24.44MB)

网友评论