liblevenshtein-java:关于Levenshtein换能器的各种实用程序。 (Java)

时间:2024-06-12 17:19:44
【文件属性】:

文件名称:liblevenshtein-java:关于Levenshtein换能器的各种实用程序。 (Java)

文件大小:893KB

文件格式:ZIP

更新时间:2024-06-12 17:19:44

computer-science search-engine data-science machine-learning natural-language-processing

蛇毒蛋白 Java 一个基于Levenshtein自动机生成有限状态传感器的库。 Levenshtein换能器接受一个查询词,并返回字典中所有n个拼写错误以内的词。 它们构成了一个高效率(时间和空间)类拼写校正器的工作非常出色,当你不需要背景而提出建议。 忘了在你的字典进行线性扫描以发现足够,贴近用户的查询所有条款,使用二次实施的或,这些婴儿找到所有从你的字典中的线性时间上的条件查询词的长度(不取决于字典的大小,而是查询词的长度)。 如果需要上下文,则将换能器生成的候选对象作为起点,然后将其插入用于上下文的任何模型中(例如,通过选择最有可能出现在一起的术语序列)。 要进行快速演示,请访问。 还有一个命令行界面 。 请查看其README.md以获取和使用信息。 该库当前是用Java,CoffeeScript和JavaScript编写的,但是我很快会将其移植到其他语言。 如果您想要使用


网友评论