文件名称:java词典源码-WordSeperator:Java源代码和字典,可用于将复合词分隔为子词
文件大小:4KB
文件格式:ZIP
更新时间:2024-06-09 12:24:06
系统开源
java字典源码字词分隔符 Java源代码和字典,可用于将复合词分隔为子词。 编译并使用字典作为参数运行Seperator。 字典必须以行分隔,并且理想情况下不应包含任何复合词。 复杂度估算 空间复杂度 数据结构 字典被存储为Trie-Data结构。 字典存储为树,而每个节点都是一个字母。 通过遍历树,您可以迭代字典中的单词,直到到达布尔值设置为true的节点。 这意味着从词根到该单词的路径形成了一个单词,该单词包含在词典中。 因此,我们将每个树存储一个布尔值,一个字符以及一个可能的HashMap,而不是将每个单词保存为字符串,而是将其简化为包含的字符数量,并使用HashIndex来对单词进行访问。最多包含29个键值对。 我们在这里使用HashMap不会浪费只能包含空指针的数组的空间。 在这种情况下,我们需要在树中存储约16000个节点,并且字典中只有33.000个字符。 优点是,如果单词共享相同的前缀,则无需多次存储这些字符。 似乎随着字典大小的增加,这种数据结构将获得回报,在这种情况下,它可能会过于庞大。 时间复杂度 如果要在长度为n的单词中寻找子串,我们会从第一个字母开始,一直到
【文件预览】:
WordSeperator-master
----Trie.java(3KB)
----README.md(4KB)
----WordSeperator.java(2KB)