文件名称:umaru:使用LSTMGRU-RNN,CTC技术的基于火炬的OCR系统,并参考rnnlib和clstm的工作
文件大小:54KB
文件格式:ZIP
更新时间:2024-05-19 16:52:12
Lua
乌玛鲁 一个基于炬的OCR系统,使用LSTM / GRU-RNN,CTC技术,并参考了rnnlib和clstm的工作。 注意 现在这项工作是完全不稳定,实验性和开发中的。 依存关系 (及后续包装) 图像 nn /立方 乐观的 建造 $ ./build.sh 用法 一般的 您可以直接在main.lua修改设置并执行th main.lua ,输入格式类似于clstm( .png和.gt.txt对),并且应将所有输入文件路径都放在文本文件中。 或者,如果您更喜欢使用JSON格式的配置文件,则可以遵循以下示例并运行: $ th main.lua -setting [setting file] 运行文件夹 将为每个实验在experments文件夹中创建一个文件夹。 您可以在此处查看日志,设置和保存的模型。 示例配置文件 每个选项的描述都可以在main.lua找到。 { "project
【文件预览】:
umaru-master
----normalizer.cc(7KB)
----main.lua(8KB)
----libctc.cc(8KB)
----rbm.lua(10KB)
----ocr.lua(564B)
----random-test.py(437B)
----sample_setting.json(517B)
----ctc_lua.lua(3KB)
----test_ctc.lua(2KB)
----solve.lua(2KB)
----gaussian_test.py(1KB)
----ctc_log.lua(7KB)
----convert_space_sep_data_to_lua_tensor.py(263B)
----test_thread1.lua(326B)
----test_sharedclone.lua(2KB)
----LICENSE(6KB)
----test_gru.lua(364B)
----test_ctc_large.lua(60KB)
----slider.lua(1KB)
----test_slider.lua(250B)
----codec.lua(555B)
----GRU.lua(7KB)
----test_thread.lua(4KB)
----.gitignore(513B)
----pretrain.lua(2KB)
----test_codec.lua(329B)
----CMakeLists.txt(739B)
----test_cuda_ctc.lua(451B)
----README.md(2KB)
----contrast.txt(3KB)
----utils()
--------decoder.lua(483B)
--------levenshtein.lua(653B)
--------logs.lua(1KB)
----build.sh(62B)
----test_normalizer.lua(274B)
----test_cuda.lua(1KB)
----ctc.lua(3KB)
----loader.lua(5KB)