文件名称:用文本数据预测回报-研究论文
文件大小:1.95MB
文件格式:PDF
更新时间:2024-06-29 05:01:54
Text Mining Machine
我们引入了一种新的文本挖掘方法,可以从新闻文章中提取信息来预测资产回报。 与用于股票收益预测的更常见的情绪分数(例如,由商业供应商出售或使用基于字典的方法构建的分数)不同,我们的监督学习框架构建了一个专门针对收益预测问题的分数。 我们的方法分三个步骤进行:1)通过预测筛选隔离术语列表,2)通过主题建模为这些词分配预测权重,3)通过惩罚似然将术语聚合为文章级预测分数。 我们以最少的假设从我们的模型中得出对估计准确性的理论保证。 在我们的实证分析中,我们研究了金融系统中受监控最活跃的新闻文章流之一——道琼斯通讯社——并表明我们的监督文本模型擅长在这种情况下提取回报预测信号。 新闻专线中的信息以低效的延迟被同化到价格中,这与套利限制(即,对规模较小且波动性较大的公司更为严重)大体一致,但可以在具有合理营业额和净额的实时交易策略中加以利用。交易成本。