文件名称:LSTM-Encoder-for-Driver-Telematics:尝试使用深度学习方法解决Kaggle AXA驱动程序远程信息处理挑战
文件大小:19.67MB
文件格式:ZIP
更新时间:2024-06-10 00:23:53
Lua
这是使用深度学习技术来解决Kaggle中AXA驱动程序远程信息处理挑战的一种方式。 有关比赛的信息,请参见下面的链接。 方法: 首先,问题定义是异常检测之一。 像其他团队一样,我们将离群值检测问题转换为分类问题,在该问题中,我们针对每次旅行对它是否属于驾驶员进行分类。 因此,对于每个驾驶员,我们运行一个二进制分类问题,在200个提供的旅行中,有160个作为训练,20个作为验证,20个作为测试。 从其他100位驾驶员中选择了10至50次旅行。 数据集保持不平衡。 对给定的数据执行最少的特征生成步骤。 我们在4秒的窗口中提取了速度,加速度和方向变化的最小值,最大值和平均值。 因此,对于持续200秒的行程,将有50个针对我们模型的特征输入向量的序列。 此外,行程长度缩短到200的最接近倍数,以便在处理时易于使用。 模型: 由于数据的顺序性质,我们使用了多层RNN / LSTM来对驾驶员行
【文件预览】:
LSTM-Encoder-for-Driver-Telematics-master
----lstm_utils.lua(6KB)
----train.lua(8KB)
----trainDeepLSTM.lua(11KB)
----dataBatchLoader.lua(5KB)
----proc_data()
--------classmap_2908.csv(13KB)
--------classmap_2969.csv(14KB)
--------classfile_1051.csv(104KB)
--------datafile_3609.csv(5.49MB)
--------classfile_3609.csv(101KB)
--------datafile_1051.csv(5.73MB)
--------datafile_1610.csv(7.19MB)
--------datafile_2969.csv(7.3MB)
--------datafile_1576.csv(5.71MB)
--------datafile_3599.csv(5.62MB)
--------classfile_1156.csv(132KB)
--------datafile_1156.csv(7.09MB)
--------datafile_2908.csv(6.74MB)
--------classmap_1156.csv(14KB)
--------classfile_2071.csv(145KB)
--------classmap_1576.csv(11KB)
--------classfile_1610.csv(132KB)
--------datafile_2071.csv(7.89MB)
--------classmap_1051.csv(11KB)
--------classfile_1576.csv(107KB)
--------classmap_2071.csv(15KB)
--------classmap_3609.csv(10KB)
--------classfile_2908.csv(121KB)
--------classfile_2969.csv(131KB)
--------classmap_3599.csv(11KB)
--------classmap_1610.csv(14KB)
--------classfile_3599.csv(106KB)
----dataProcess.py(8KB)
----README.md(4KB)
----run.sh(1KB)
----preprocess_data.py(5KB)
----LSTM.lua(4KB)
----trainDeepLSTM.lua~(12KB)
----torchConfig.lua(109B)
----preprocess_data.py~(5KB)
----run.sh~(1KB)
----loadData.lua(1KB)
----README.md~(4KB)