爬虫代码matlab-SentimentAnalysis:检测新闻文章中的情绪

时间:2024-06-27 14:41:21
【文件属性】:

文件名称:爬虫代码matlab-SentimentAnalysis:检测新闻文章中的情绪

文件大小:12.75MB

文件格式:ZIP

更新时间:2024-06-27 14:41:21

系统开源

爬虫代码matlab 情绪分析 检测新闻文章中的情绪该项目旨在根据新闻文章的情绪对新闻文章进行分类。 我们考虑了多个类别。 例如,悲伤、可怕、愚蠢、怪异等。我们从 fark.com 获取数据并训练我们的模型来预测相应文章中调用的情绪。 阅读附有代码的论文将是有益的。 它将帮助您理解模型。 存储库可以解释为: 数据集:它包含我们用于训练模型的示例数据集 Matlab:该文件夹包含使用的 matlab 代码。 它有 KNearest Neighbor 的代码,带有交叉验证的 SVM 词法链:它有词法链分析的代码 神经网络:我们尝试使用神经网络,但没有成功。 如果将来在基线精度计算器中取得任何进展,将更新:它用于计算基线。 我们基线的描述出现在论文特征向量生成器中:此代码获取文本并将其转换为特征向量。 我们使用了 bag 或 word,即 unigram、bigram、trigram,我们还使用了 TF-IDF 和更多的感知器:它包含我们用来一次分析两个情感类别的感知器代码 Web Crawler:这是用于从 Fark.com 提取数据:


【文件预览】:
SentimentAnalysis-master
----Final Project Report.pdf(319KB)
----neural network()
--------NN.m(1KB)
----baseline accuracy calculator()
--------baseline.java(6KB)
----lexical chain()
--------WordNetDemo.java(15KB)
----Matlab Codes()
--------trainSVM.m(408B)
--------SVMwithCV.m(1KB)
--------classifySVM.m(338B)
--------KNN.m(2KB)
--------SVM_withoutCV.m(586B)
--------testSVM.m(432B)
----README.md(1KB)
----web crawler()
--------Main.java(4KB)
----Dataset()
--------allemotionsheadlinecontent.txt(31.01MB)
----feature vector generator()
--------idftf svm.txt(11KB)
--------tfidf.java(8KB)
--------filereader.java(6KB)
----perceptron()
--------perceptron.py(4KB)

网友评论