利用Python对时间序列进行分类与聚类

时间:2024-01-03 09:15:29
【文件属性】:

文件名称:利用Python对时间序列进行分类与聚类

文件大小:3.18MB

文件格式:ZIP

更新时间:2024-01-03 09:15:29

时间序列 聚类 分类

可靠的方法去判断两个时间序列是否相似,截下来便可以使用k-NN算法进行分类。根据经验,最优解一般出现在k=1的时候。下面就利用DTW欧氏距离的1-NN算法。在该算法中,train是时间序列示例的训练集,其中时间序列所属的类被附加到时间序列的末尾。test是相应的测试集,它所属于的类别就是我们想要预测的结果。在该算法中,对于测试集中的每一个时间序列,每一遍搜索必须遍历训练集中的所有点,从而可以找到最多的相似点。考虑到DTW算法是二次方的,计算过程会耗费非常长时间。我们可以通过LB Keogh下界方法来提高分类算法的计算速度。计算机运行LB Keogh的速度会比运行DTW的速度快很多。另外,当LB


【文件预览】:
README.md
spatio-time cluster.py
datasets
----test.csv(195KB)
----train.csv(195KB)
金融时间序列聚类分析方法比较研究--基于上市公司股票收益率的实证分析.pdf
Time Series Classification and Clustering.ipynb
利用Python对时间序列进行分类与聚类.pdf
classification
----ts_classifier.py(3KB)
clustering
----ts_cluster.py(3KB)

网友评论