MLClassifier:机器学习系统,用于对OCR(ed)文档进行分类

时间:2024-03-22 19:52:25
【文件属性】:

文件名称:MLClassifier:机器学习系统,用于对OCR(ed)文档进行分类

文件大小:18KB

文件格式:ZIP

更新时间:2024-03-22 19:52:25

C

MLClassifier(SQL) 说明:纯SQL机器学习系统。 旨在在监督学习下处理OCR(ed)业务文档(发票,合同等)。 在MariaDB 10.5.4上测试。 系统假定您拥有将文档(例如PDF)转换为唯一(相关)单词列表的方式。 要求 像Linux一样运行Ubuntu或Debian: sudo apt install mariadb-server mariadb-client 安装方式 运行make install将架构部署到您MySQL / MariaDB服务器中。 该脚本将询问您数据库的名称。 make install 用法 学 通过将文档(例如发票)中出现的单词与提供的类别(例如公司名称)相关联来训练算法 Learn(d,c,w)存储过程将“单词”列表与已知的人类分类类别“关联”。 期望: 域-要处理的文档类型的通用名称(例如,发票,薪金收据等)。 类别-此


【文件预览】:
MLClassifier-master
----01_tables()
--------05_ClassifiedDocs.sql(336B)
--------01_Domains.sql(476B)
--------02_Categories.sql(308B)
--------04_InputPerCategory.sql(370B)
--------06_Mappings.sql(166B)
--------03_Inputs.sql(445B)
----02_C_Extensions()
--------myHelloWorld.c(2KB)
--------prebuild.sh(414B)
--------udf_example_c.txt(33KB)
----04_test()
--------sample.sql(598B)
----.gitignore(14B)
----03_procedures()
--------03_Predict.sql(1KB)
--------05_Purge.sql(702B)
--------02_Learn.sql(3KB)
--------04_ExplainPrediction.sql(885B)
----Makefile(475B)
----README.md(2KB)

网友评论