corpus.sinhala.tools

时间:2024-07-15 01:27:15
【文件属性】:

文件名称:corpus.sinhala.tools

文件大小:18KB

文件格式:ZIP

更新时间:2024-07-15 01:27:15

Java

安装 克隆 安装依赖项并通过命令“mvn clean install”构建 包括功能 SinhalaTokenizer 包括将僧伽罗语文本拆分为单词和句子的方法。 SinhalaVowelLetterFixer 包括自动修复“一个僧伽罗字符的多个元音”问题的方法。 用法 SinhalaTokenizer 的使用 SinhalaTokenizer tokenizer = new SinhalaTokenizer (); LinkedList< String> words = tokenizer . splitWords(sinhalaText); LinkedList< String> sentences = tokenizer . splitSentences(sinhalaText); SinhalaVowelLetterFixer 的用法 SinhalaVowelLe


【文件预览】:
corpus.sinhala.tools-master
----src()
--------main()
--------test()
----.travis.yml(110B)
----pom.xml(1KB)
----README.md(860B)

网友评论