文件名称:情绪分析
文件大小:35.33MB
文件格式:ZIP
更新时间:2024-03-03 19:47:58
JupyterNotebook
情绪分析 作者:ÁlvaroHuertasGarcía 指数 储存库目的 在此存储库中,我们介绍了在开发基于机器学习和深度学习变压器的模型以预测英语和西班牙语的文本极性之后获得的结果。 机器学习模型 机器学习朴素贝叶斯,K最近邻,逻辑回归和随机森林算法用作分类器。 遵循两种策略将SST2语料库数据编码为向量,这些向量将用作ML算法的输入。 在第一个中,单词嵌入是通过结合TF-IDF对SST2语料数据进行Word2Vec训练而得出的。 在第二篇文章中,单词嵌入来自部分已在Google新闻数据集中进行过预训练的Word2Vec模型。 这种经过预先训练的Word2Vecmodel具有将更多文本数据合并到训练中的优势。 在这两种情况下,为了将一个句子表示为一个向量,我们将所有单词向量的平均数取为平均。 因此,平均向量表示句子嵌入。 关于开发的基于深度学习变压器的模型,在最小化二进制交叉熵损失函数
【文件预览】:
Sentiment_Analysis-main
----sst2_models()
--------ML()
--------DL()
----README.md(2KB)
----sst_2_data()
--------sentiment-test(190KB)
--------sentiment-dev(93KB)
--------sentiment-train(3.63MB)
----sst_5_data()
--------sentiment-test(228KB)
--------sentiment-dev(114KB)
--------sentiment-train(882KB)
--------translation()