文件名称:stanza-batch:Stanza的批处理实用程序
文件大小:128KB
文件格式:ZIP
更新时间:2024-06-07 07:11:40
Python
节批处理 快速链接 介绍 当前支持版本1.1.1和1.2.0 是用于Stanza的批处理实用程序,它使使用Stanza更快,更轻松地处理文档/文本。 Stanza当前的批处理建议是将文档与每个文档连接在一起,并用空行( \n\n )分隔每个文档。 这种批处理方式有一个主要缺点: 处理此文档的返回结果是一个带有很多句子的Stanza文档,因此您不知道一个文档的结束位置,而另一个文档的起始位置很容易。 这个批处理实用程序解决了这个问题,当给定文档列表时,它将返回相应的已处理的Stanza文档列表。 下面我们比较了当前的Stanza批处理系统以及该实用程序的批处理方式: import stanza from stanza . models . common . doc import Document # Documents to process document_1 = 'Hello
【文件预览】:
stanza-batch-main
----pyproject.toml(89B)
----pytest.ini(27B)
----.github()
--------workflows()
----gpu_profile_plots()
--------clear_cache.png(28KB)
--------non_clear_cache.png(24KB)
----stanza_batch()
--------__init__.py(17KB)
--------version.py(18B)
----tests()
--------data()
--------test_stanza_batch.py(16KB)
----LICENSE(11KB)
----mypy.ini(434B)
----dev-requirements.txt(50B)
----requirements.txt(21B)
----setup.py(1KB)
----.gitignore(101B)
----README.md(13KB)
----profile_stanza.py(2KB)
----.flake8(191B)