Enhanced-Error-Correction-in-Large-Volume-OCR-Datasets

时间:2024-06-25 00:09:51
【文件属性】:

文件名称:Enhanced-Error-Correction-in-Large-Volume-OCR-Datasets

文件大小:26KB

文件格式:ZIP

更新时间:2024-06-25 00:09:51

Java

大体积 OCR 数据集中的增强型纠错 系统需要标准的 Spark 安装和命令行指定的 Apache commons math jar,如下所示。 在可以启动 shell 之前,生成一个 Ergo 引擎 ./bin/spark-submit --master local[*] --jars commons-math3-3.5.jar --class ee6895ta.ProcessData /clients/spark/sparktest.jar init 然后用 ./bin/spark-submit --master local[*] --jars commons-math3-3.5.jar --class ee6895ta.ProcessData /clients/spark/sparktest.jar infer 推断出真相 启动 shell: ./bin/spark-submit


【文件预览】:
Enhanced-Error-Correction-in-Large-Volume-OCR-Datasets-master
----VP.java(668B)
----TF.java(6KB)
----ProcessData.java(2KB)
----Ergo.java(11KB)
----Misread.java(497B)
----OCRBinomalTest.java(218B)
----InitRawFrequencies.java(5KB)
----Edit.java(396B)
----Range.java(678B)
----IdentifyMisreads.java(6KB)
----Corrector.java(3KB)
----TestRanger.java(1KB)
----LICENSE(1KB)
----ErgoShell.java(3KB)
----InitRawVariants.java(4KB)
----README.md(781B)
----OCRUtility.java(7KB)
----TopMisreads.java(4KB)
----InferTruth.java(5KB)
----OCRObject.java(3KB)
----DVF.java(582B)

网友评论