文件名称:clictagger:Python模块来识别文本中的区域
文件大小:39KB
文件格式:ZIP
更新时间:2024-04-22 21:44:28
Python
CLiCTagger区域标记 用于识别文本区域的Python模块。 安装 Linux 首先,请确保您已安装以下先决条件: apt-get install python3 python3-dev \ libicu-dev pkg-config 然后通过安装。 点: pip install git+https://github.com/birmingham-ccr/clictagger 用法 Python笔记本 在此处查看示例笔记本: : 命令行 现在,您应该可以使用clictagger命令。 有关用法,请参见--help 。 以下是一些示例。 要查看带有彩色区域的alice.txt的内容,请执行以下alice.txt : clictagger alice.txt 输出所有悬浮在alice.txt到alice.csv : clictagger --csv alice.c
【文件预览】:
clictagger-main
----README.rst(1KB)
----getting_started.ipynb(25KB)
----clictagger()
--------tokenizer.py(9KB)
--------region()
--------table.py(3KB)
--------icuconfig.py(225B)
--------__init__.py(2B)
--------migrate()
--------taggedtext.py(5KB)
--------script.py(4KB)
--------markup.py(6KB)
----environment.yml(89B)
----pytest.ini(79B)
----conftest.py(2KB)
----tests()
--------test_tokenizer.py(982B)
--------__init__.py(2B)
----dev-requirements.txt(40B)
----install.sh(1KB)
----setup.py(607B)
----.gitignore(163B)
----Makefile(843B)