TBXTools:用于术语提取和管理的 Python 类-开源

时间:2024-06-20 07:13:36
【文件属性】:

文件名称:TBXTools:用于术语提取和管理的 Python 类-开源

文件大小:599.17MB

文件格式:ZIP

更新时间:2024-06-20 07:13:36

开源软件

TBXTools 可以轻松快速地提取和管理术语。 该工具实现了统计和语言方法,以及一些用于创建和管理术语数据库的实用程序。 它是用 Python 编写的,使用 NLTK(Natural Language Toolkit)项目已移至 Github:https://github.com/aoliverg/TBXTools


【文件预览】:
talk-TBXTools-code_examples
----1-Statistical()
--------JRC-control-evaluation-terms2g3g-eng.txt(4KB)
--------statistical1.py(394B)
--------inner-stop-eng.txt(50B)
--------statistical-eva1.py(703B)
--------statistical-eva2.py(759B)
--------statistical5.py(638B)
--------corpus-control-JRC-seg-eng.txt(75KB)
--------TBXTools.py(100KB)
--------statistical3.py(493B)
--------statistical4.py(536B)
--------statistical2.py(450B)
--------exclusion-regexps.txt(159B)
--------statistical-eva3.py(808B)
--------statistical-eva4.py(851B)
--------stop-eng.txt(3KB)
--------statistical-eva5.py(964B)
----3-Translation_equivalents()
--------findtranslationPTable.py(365B)
--------JRC-Acquis.en-es.en(92.41MB)
--------equivalents2.py(486B)
--------SLterms.txt(4KB)
--------indexacio.py(163B)
--------phrase-table.gz(522.57MB)
--------TBXTools.py(109KB)
--------JRC-Acquis.en-es.es(104.79MB)
--------stop-spa.txt(1KB)
--------equivalents1.py(358B)
----ATE_Techniques_in_TBXTools.pdf(217KB)
----2-Linguistic()
--------patterns-formes.txt(139B)
--------JRC-control-evaluation-terms2g3g-lemmata-eng.txt(4KB)
--------corpus-control-JRC-tagged-eng.txt(188KB)
--------JRC-control-evaluation-terms2g3g-eng.txt(4KB)
--------learnpatterns.py(383B)
--------JRC-Acquis.en-es.tagged.en(238.98MB)
--------termstolearn.txt(200KB)
--------linguistic-eva1-lemmata.py(761B)
--------patterns-lemes.txt(139B)
--------corpus-control-JRC-seg-eng.txt(75KB)
--------TBXTools.py(100KB)
--------linguistic1.py(408B)
--------linguistic0.py(306B)
--------linguistic-eva1-forms.py(732B)

网友评论