文件名称:The Charabia Normalizer-开源
文件大小:49KB
文件格式:GZ
更新时间:2024-05-15 21:32:13
开源软件
用Java编写的基于上下文的基于规则的文本标准化引擎,可用于实现词干算法或语音标准化器。 该项目包括一个法语词干/语音标准化器和一个soundex实现。 包括Lucene分析仪
【文件预览】:
normalizer-1.0
----CVSROOT()
--------loginfo(1KB)
--------taginfo(879B)
--------commitinfo(760B)
--------verifymsg(1KB)
--------notify(564B)
--------modules(1KB)
--------cvswrappers(753B)
--------editinfo(1KB)
--------config(527B)
--------checkoutlist(493B)
--------rcsinfo(649B)
----doc()
--------RULES.txt(4KB)
----LICENSE(26KB)
----normalizer.jar(34KB)
----build.xml(2KB)
----data()
--------french.trans(8KB)
--------soundex.trans(590B)