文件名称:EECS731_Project06
文件大小:2.04MB
文件格式:ZIP
更新时间:2024-03-04 23:27:40
JupyterNotebook
项目6-D(St)异常区域 现实世界不会因不良数据而变慢 在GitHub帐户中的新git存储库中设置数据科学项目结构 从或下载基准数据集 将其中一组数据加载到熊猫数据帧中 提出一两个关于要素工程如何使用探索性数据分析帮助数据集建立附加价值的想法 建立一个或多个异常检测模型,以其他列为特征来确定异常 记录您的过程和结果 将您的笔记本,源代码,可视化文件和其他支持文件提交到GitHub中的git存储库 特征工程 此数据集中的数据类型很少,因此我们很难再次将它们组合起来。 一个很好的解决方案是将它们细分以增加数据的多样性和差异性。 为此,我们将时间数据分为特定的年,月,日,小时和分钟。 这样,您不仅可以探索数据的及时性,还可以观察其周期性。 对于唯一的数据,这是时分的。
【文件预览】:
EECS731_Project06-master
----project06.py(3KB)
----data()
--------artificialWithAnomaly()
--------realAdExchange()
--------realTweets()
--------artificialNoAnomaly()
--------realKnownCause()
--------README.md(3KB)
--------realAWSCloudwatch()
--------realTraffic()
----notebook()
--------project06.ipynb(94KB)
--------.ipynb_checkpoints()
----visualization()
--------Figure_3.png(61KB)
--------Figure_2.png(96KB)
--------Figure_4.png(62KB)
--------Figure_1.png(86KB)
----.DS_Store(6KB)
----README.md(1KB)