EDA是一种使用视觉技术分析数据的方法。它用于发现趋势和模式,或借助统计摘要和图形表示来检查假设。
3.1 股票的开盘、收盘价
plt.style.use("fivethirtyeight")
plt.plot(df['Date'], df['Open'], color="blue", label="open")
plt.plot(df['Date'], df['Close'], color="green", label="close")
plt.title("Microsoft Open-Close Stock")
plt.legend()
3.2 股票的交易量
交易量是指一段时间内(通常是一天内)易手的资产或证券的数量。例如,股票交易量是指每天开盘和收盘之间交易的证券股票数量。交易量以及交易量随时间的变化是技术交易者的重要输入。
plt.plot(df['Date'], df['Volume'])
plt.show()
3.3 股票不同特征之间的相关性
相关性是一种衡量两个变量相对于彼此移动程度的统计数据,其值必须介于-1.0和+1.0之间。相关性衡量关联,但不显示 x 是否导致 y,反之亦然,或者关联是否由第三个因素引起。
sns.heatmap(df.corr(), annot=True, cbar=False)
plt.show()
现在,让我们绘制 2015 年至 2021 年期间 Microsoft 股票的收盘价,即 6 年的时间跨度。