文件名称:tei_reader:TEI Reader Python库
文件大小:127KB
文件格式:ZIP
更新时间:2024-05-11 04:08:55
Python
用于读取TEI P5(精简版)文件的文本内容和元数据的Python 3库 该库专注于从文件中提取主要文本内容,并提供有关文本的可用元数据。 TL; DR pip install tei-reader from tei_reader import TeiReader reader = TeiReader () corpora = reader . read_file ( 'example-tei.xml' ) # or read_string print ( corpora . text ) # show element attributes before the actual element text print ( corpora . tostring ( lambda x , text : str ( list ( a . key + '=' + a . text for a in
【文件预览】:
tei_reader-master
----setup.py(852B)
----.gitignore(23B)
----requirements.txt(166B)
----__init__.py(0B)
----.travis.yml(121B)
----LICENSE(1KB)
----README.md(2KB)
----tests()
--------test_attributes.py(1KB)
--------update_test_outputs.py(1KB)
--------test_text.py(934B)
--------__init__.py(0B)
--------test_dtd.py(590B)
--------xslt()
--------context.py(369B)
--------test_transform.py(1KB)
----tei.tar(280KB)
----tei_reader()
--------__init__.py(34B)
--------models()
--------transform()
--------tei_reader.py(3KB)
----requirements.in(20B)