sentiment-classification:使用IMDB数据集进行情感分类

时间:2024-03-29 10:25:55
【文件属性】:

文件名称:sentiment-classification:使用IMDB数据集进行情感分类

文件大小:4.73MB

文件格式:ZIP

更新时间:2024-03-29 10:25:55

JupyterNotebook

情感分类 情感分类 情感分类是分析一段文本并预测某人是否不喜欢他们在说的事情的任务。 输入:一段文字 输出:情绪 数据集 我正在使用进行模型训练,它包含两列 前处理 代币化 令牌化是将文本,短语,句子,文档分成较小的“块”或“令牌”的过程 例如: “嘿,好久不见了” 令牌: “嘿”,“有”,“长”,“时间”,“否”,“看到” 通过定位单词边界来创建较小的单位或令牌,单词边界是单词的终点和下一个单词的开头。 排序和填充 排序用于将我们的文本用作神经网络中的输入层 “嘿,那里”,“嘿,那里儿” [['1 2'],['1','2','3']] 进行填充以使向量输入具有相同的大小 [[1,2] [1,2,3] 语料库将具有不同大小的句子,如上面的示例所示。 进行填充以使其大小相同 [[0 1 2] [1 2 3] 模型 该模型架构是使用tf.keras.utils.plot


【文件预览】:
sentiment-classification-main
----.ipynb_checkpoints()
--------sentimentclassifcationrnn-checkpoint.ipynb(2.26MB)
----sentimentclassifcationrnn.ipynb(2.26MB)
----model()
--------mask_model.h5(2.44MB)
--------model.json(5KB)
--------group1-shard1of1.bin(811KB)
----web()
--------statics()
--------templates()
----README.md(2KB)

网友评论