文件名称:wagtail_textract:用于Wagtail文档搜索的文本提取
文件大小:1012KB
文件格式:ZIP
更新时间:2024-02-26 22:08:18
search django wagtail tesseract text-extraction
用于Wagtail文档搜索的文本提取 该程序包用于替换的Document类,该类允许使用搜索Document文件内容。 Textract可以从文本中提取(中)PDF,Excel和Word文件。 该软件包的灵感来自Wagtail中的。 文档将像以前一样工作,除了Wagtail的管理界面中的“文档搜索”还将在文件内容中找到搜索词。 一些截图说明。 在安装了wagtail_textract全新wagtail_textract网站中,我们上传了一个的包含手写文本。 它在管理界面中的文档下列出: 现在,如果我们在“文档”中搜索“ correct ”一词(手写单词之一),则实时搜索会找到它:
【文件预览】:
wagtail_textract-master
----setup.py(2KB)
----.gitignore(110B)
----Makefile(251B)
----CHANGES.rst(644B)
----src()
--------wagtail_textract()
----.travis.yml(503B)
----MANIFEST.in(244B)
----LICENSE(1KB)
----setup.cfg(20B)
----travis-textract-requirements()
--------python.sh(486B)
--------python-doc.txt(133B)
--------debian.sh(788B)
--------debian(720B)
--------python.txt(577B)
--------python-dev.txt(392B)
----README.md(6KB)
----pytest.ini(151B)
----docs()
--------screenshot_document_search_correct.png(62KB)
--------screenshot_document_list_test_document.png(54KB)
----tox.ini(986B)