文件名称:dsc-classification-with-word-embeddings-codealong-nyc-ds-010620
文件大小:24.46MB
文件格式:ZIP
更新时间:2024-04-20 06:22:10
JupyterNotebook
带词嵌入的分类-Codealong 介绍 在本课程中,您将使用在本节中学到的所有内容,通过单词嵌入来执行文本分类! 目标 你将能够: 使用流行的预训练模型(例如GloVe)中的预训练词嵌入 使用Keras将层嵌入神经网络 入门 加载数据以及所有库和函数。 import pandas as pd import numpy as np np . random . seed ( 0 ) from nltk import word_tokenize from gensim . models import word2vec 现在,加载数据集。 您将使用与本节先前实验中相同的数据集,您可以在News_Category_Dataset_v2.zip找到该数据集。 进入仓库并解压缩该文件,然后继续。 解压缩该数据集后,请继续使用pandas读取下面单元格中存储在'News_Category_Dat
【文件预览】:
dsc-classification-with-word-embeddings-codealong-nyc-ds-010620-master
----.gitignore(28B)
----LICENSE.md(1KB)
----CONTRIBUTING.md(2KB)
----README.md(20KB)
----News_Category_Dataset_v2.zip(24.44MB)
----.learn(87B)
----index.ipynb(27KB)