文件名称:米米尔洞穴
文件大小:115KB
文件格式:ZIP
更新时间:2024-03-03 00:49:44
Scala
Mimir-Caveats 警告是Spark的一个简单的污点跟踪系统,可帮助您跟踪将来可能需要更改的值。 例如: 占位符值:在准备工作流时,使用警告来跟踪正在使用的占位符---在部署工作流之前,请确保所有占位符都已消失。 “现在足够好” :使用警告来跟踪近似值,例如估算值,在基于数据集做出最终决策之前可能需要细化或检查这些近似值。 离群值:使用警告来跟踪离群值,这些离群值可能需要根据您要问的问题进行不同的处理。 注意事项 使用隐式的caveat Column来标记值。 在以下示例中,我们加载一些传感器读数。 错误的读数将替换为先前的读数,并且我们用警告标记替换的值。 import org . mimirdb . caveats . implicits . _ val df = spark.read .format( " csv " ) .optio
【文件预览】:
mimir-caveats-master
----.travis.yml(755B)
----.gitlab-ci.yml(121B)
----src()
--------test()
--------main()
----build.sbt(3KB)
----DEVEL.md(2KB)
----.gitignore(131B)
----test_data()
--------s.csv(31B)
--------r.csv(46B)
--------CPUSpeed.csv(24KB)
--------tip.csv(38B)
--------parquet_r()
--------t.csv(31B)
--------timestamp.csv(232B)
----README.md(9KB)