文件名称:Word-Embedding-and-Sentiment-Analysis-based-stock-prediction
文件大小:43.53MB
文件格式:ZIP
更新时间:2024-04-01 23:15:22
Python
基于词嵌入和情感分析的股票预测 介绍: 在这个项目中,我们在金融新闻数据集上使用了几种词嵌入方法,以创建史前股价数据集的附加功能,并训练了一个模型来预测特定时间的收盘价。 我们将该问题表述为回归问题。 我们首先构建时间序列数据,然后使用前30天的数据来预测第二天的收盘价。 我们使用的主要工具基于名为“ BERT”的语言模型,即来自变压器的双向编码器表示形式。 在这个项目中,我们将使用LSTM和下面列出的每个工具训练模型,并比较它们的结果。 最后,我们将尝试整合用于训练最终模型的工具,并希望获得更好的结果。 工具: 先决条件 1按照存储库建议安装 。 我们使用他们的environment.yml设置环境。 另外,您需要从此链接下载的模型: 2。安装。 3维德。 安装nltk pip install nltk 4 。 具体来说,您需要以下的模型:wiki-news-300d-1M.v
【文件预览】:
Word-Embedding-and-Sentiment-Analysis-based-stock-prediction-master
----src()
--------vader()
--------lstm()
--------.DS_Store(6KB)
--------fasttext()
--------mittal_paper()
--------finbert()
--------preprocessing.py(9KB)
--------img()
--------SRAF()
--------sbert()
----json_files()
--------date_to_company_to_vader.json(6.45MB)
--------syn_to_POMS_fasttext.json(7KB)
--------date_to_company_to_sraf.json(8.28MB)
--------finbert_with_summarize.json(8.64MB)
--------date_to_moods.json(74KB)
--------syn_to_POMS_combined.json(13KB)
--------syn_to_POMS_wordnet.json(8KB)
--------news.json(61.9MB)
--------date_to_articles_array.json(63.79MB)
--------LM_Dict.json(99KB)
--------finbert.json(8.63MB)
----environment.yml(387B)
----README.md(27KB)
----.gitignore(5KB)