NewsArticle_TextClassification

时间:2024-03-06 02:30:06
【文件属性】:

文件名称:NewsArticle_TextClassification

文件大小:11.43MB

文件格式:ZIP

更新时间:2024-03-06 02:30:06

JupyterNotebook

新闻文章文字分类 该项目执行带有文本分类的监督式机器学习。 文本分类是根据文本的内容为文本分配类别的过程。 当将文本组织成类别时,从文本中提取有用的见解和信息会容易得多。 但是手动对文本进行分类可能非常耗时且成本很高。 文本分类可以通过自动化过程极大地加快这一过程。 更具体地说,在此项目中,我们将根据文章标题对新闻文章执行Naive Bayes分类器。 该数据集包含超过12万个新闻文章标题样本。 数据是由学术新闻搜索引擎从2000多个新闻来源收集的。 数据集中的每个样本都分类为体育,商业,世界和科学技术。


【文件预览】:
NewsArticle_TextClassification-main
----NB_TextClassification.ipynb(18KB)
----data.zip(11.43MB)
----README.md(844B)

网友评论