【文件属性】:
文件名称:dsc-classification-with-word-embeddings-codealong-nyc-ds-010620
文件大小:24.46MB
文件格式:ZIP
更新时间:2021-03-31 12:35:30
JupyterNotebook
带词嵌入的分类-Codealong
介绍
在本课程中,您将使用在本节中学到的所有内容,通过单词嵌入来执行文本分类!
目标
你将能够:
使用流行的预训练模型(例如GloVe)中的预训练词嵌入
使用Keras将层嵌入神经网络
入门
加载数据以及所有库和函数。
import pandas as pd
import numpy as np
np . random . seed ( 0 )
from nltk import word_tokenize
from gensim . models import word2vec
现在,加载数据集。 您将使用与本节先前实验中相同的数据集,您可以在News_Category_Dataset_v2.zip找到该数据集。 进入仓库并解压缩该文件,然后继续。
解压缩该数据集后,请继续使用pandas读取下面单元格中存储在'News_Category_Dat
【文件预览】:
dsc-classification-with-word-embeddings-codealong-nyc-ds-010620-master
----.gitignore(28B)
----LICENSE.md(1KB)
----CONTRIBUTING.md(2KB)
----README.md(20KB)
----News_Category_Dataset_v2.zip(24.44MB)
----.learn(87B)
----index.ipynb(27KB)