TE田纳西-伊斯曼过程数据集简介
TE数据集是现在故障诊断中的应用较多的一种数据集。主要介绍论文上都有。
具体介绍见:http://depts.washington.edu/control/LARRY/TE/download.html
其中TE数据集的下载比较方便的有:
http://download.csdn.net/download/luohenyj/10103277
https://github.com/camaramm/tennessee-eastman-profBraatz
对于下载来的TE数据集如下图所示:
TE训练集和测试集结构
整个TE数据集由训练集和测试集构成,TE集中的数据由22次不同的仿真运行数据构成,TE集中每个样本都有52个观测变量。d00.dat至d21.dat为训练集样本,d00_te.dat至d21_te.dat为测试集样本。
d00.dat和d00_te.dat为正常工况下的样本。d00.dat训练样本是在25h运行仿真下获得的。观测数据总数为500。而d00_te.dat测试样本是在48h运行仿真下获得的,观测数据总数为960。
d01.dat至d21.dat为带有故障的训练集样本,d01_te.dat至d21_te.dat为带有故障的测试集样本。每个训练集\测试样本代表一种故障。
要值得注意的是对于带有故障的训练集样本,是在25h运行仿真下获得的。仿真开始时没有故障情况,故障是在仿真时间为1h的时候引入的。但观测数据是在引入故障后才开始采集的,即只有480个观测值。
带有故障的测试集样本是在48h运行仿真下获得的,故障在8h的时候引入,共采集960个观测值,其中前160个观测值为正常数据。
数据集提取和保存
数据的提取如下图所示:
首先通过excel数据窗口-获取外部数据-来自文本打开数据。
然后打开TE数据样本,载入数据,直接点击完成就好。但是鼠标光标最好放在excel表格A1窗口。具体参数设置如下,直接点完成即可。
最后打开的数据如下,保存为xls文档即可。