文件名称:tika-python:Tika-Python是与Apache Tika:trade_mark:REST服务结合的Python,允许在Python社区中本地调用Tika
文件大小:60KB
文件格式:ZIP
更新时间:2024-02-21 05:50:57
python nlp parse recognition buffer
蒂卡Python 库的Python端口,可通过使Tika可用。 这使得Apache Tika可以作为Python库使用,可以通过Setuptools,Pip和Easy Install进行安装。 要使用此库,您需要在系统上安装Java 7+,因为tika-python在后台启动Tika REST服务器。 受到启发。 安装(带点子) pip install tika 安装(无pip) python setup.py build python setup.py install 气隙环境设置 要使它在断开连接的环境中工作,请下载tika服务器文件(tika-server.jar和tika-server.jar.md5,均可在找到),并将TIKA_SERVER_JAR环境变量设置为TIKA_SERVER_JAR =“ file:// //tika-server.jar”成功地告诉python-tika “下载”此文件并将其移至/tmp/tika-server.jar并作为后台进程运行。 这是在不访问互联网的情况下运行python-tika的唯一方法。 如果没有此设置,则默认值为每次
【文件预览】:
tika-python-master
----.github()
--------FUNDING.yml(154B)
----LICENSE.txt(11KB)
----.coverage(1B)
----requirements.txt(64B)
----.travis.yml(160B)
----tika()
--------config.py(1KB)
--------unpack.py(5KB)
--------parser.py(5KB)
--------translate.py(3KB)
--------detector.py(2KB)
--------__init__.py(1KB)
--------tests()
--------language.py(1KB)
--------tika.py(34KB)
----setup.py(3KB)
----README.md(12KB)
----.gitignore(125B)
----MANIFEST.IN(20B)