力扣244题详解：最短单词距离 II 的多种解法与模拟面试

在本篇文章中，我们将详细解读力扣第244题“最短单词距离 II”。通过学习本篇文章，读者将掌握如何在字符串列表中多次查询两个单词之间的最短距离，并了解相关的复杂度分析和模拟面试问答。每种方法都将配以详细的解释，以便于理解。

问题描述

力扣第244题“最短单词距离 II”描述如下：

请设计一个类，使得一组单词列表 wordsDict 的多次查询中，可以有效地返回两个单词之间的最短距离。

实现 WordDistance 类：

	•	WordDistance(String[] wordsDict) 会使用单词列表 wordsDict 初始化对象。
•	int shortest(String word1, String word2) 返回列表中 word1 和 word2 的最短距离。

示例:

解题思路

方法一：预处理单词索引位置

1.	初步分析：
•	为了多次查询时能够高效地找到两个单词之间的最短距离，我们可以通过预处理字符串列表中的单词索引，将每个单词的所有出现位置存储起来。
•	在进行查询时，直接比较两个单词的索引位置，通过双指针法找到它们之间的最短距离。
2.	步骤：
•	初始化时，遍历 wordsDict，将每个单词的索引位置存储在哈希表中。
•	查询时，利用两个单词的索引列表，使用双指针法遍历，计算它们之间的最小距离。

代码实现

class WordDistance:

def __init__(self, wordsDict):
    self.word_indices = {}
    for i, word in enumerate(wordsDict):
        if word not in self.word_indices:
            self.word_indices[word] = []
        self.word_indices[word].append(i)

def shortest(self, word1, word2):
    indices1 = self.word_indices[word1]
    indices2 = self.word_indices[word2]
    i, j = 0, 0
    min_distance = float('inf')
    
    # 使用双指针比较两个索引列表，找最小距离
    while i < len(indices1) and j < len(indices2):
        min_distance = min(min_distance, abs(indices1[i] - indices2[j]))
        if indices1[i] < indices2[j]:
            i += 1
        else:
            j += 1
    
    return min_distance

测试案例

wordDistance = WordDistance([“practice”, “makes”, “perfect”, “coding”, “makes”])
print(wordDistance.shortest(“coding”, “practice”)) # 输出: 3
print(wordDistance.shortest(“makes”, “coding”)) # 输出: 1

复杂度分析

•	初始化的时间复杂度：O(n)，其中 n 是字符串列表的长度。我们需要遍历整个列表，将每个单词的索引位置存储起来。
•	查询的时间复杂度：O(l1 + l2)，其中 l1 和 l2 分别是 word1 和 word2 出现的位置数量。我们需要遍历这两个单词的索引列表来找到最小距离。
•	空间复杂度：O(n)，因为我们需要存储每个单词的所有出现位置。

模拟面试问答

问题 1：你能描述一下如何解决这个问题的思路吗？

回答：我们可以通过预处理每个单词的所有出现位置来高效解决这个问题。首先，我们将 wordsDict 中每个单词的索引位置存储在一个哈希表中。查询时，直接比较两个单词的索引位置，使用双指针法找到最短距离。这样能够在多次查询中保持高效的性能。

问题 2：为什么选择使用预处理的方法来解决这个问题？

回答：通过预处理每个单词的索引位置，我们能够加快后续查询的效率。每次查询时，直接访问预处理的结果，减少了多次遍历 wordsDict 的开销。相比直接遍历列表，预处理能够显著提升查询效率，特别是当查询次数很多时。

问题 3：你的算法的时间复杂度和空间复杂度是多少？

回答：初始化的时间复杂度是 O(n)，因为我们需要遍历整个字符串列表并记录每个单词的索引位置。查询的时间复杂度是 O(l1 + l2)，其中 l1 和 l2 是两个单词出现的次数。空间复杂度是 O(n)，因为我们需要存储每个单词的所有出现位置。

问题 4：在代码中如何处理边界情况？

回答：代码通过在初始化阶段将所有单词的索引位置存储起来，确保后续查询能够在任何情况下正确运行。对于不在列表中的单词，程序在初始化过程中已经进行了处理，避免了查询不存在的单词时出现错误。

问题 5：你能解释一下双指针法在这个问题中的具体作用吗？

回答：双指针法通过同时遍历两个单词的索引列表，每次比较它们的位置差，并移动较小的指针。这样可以确保我们在 O(l1 + l2) 时间内找到两个单词之间的最小距离，而不需要重复比较每个索引位置。

问题 6：在代码中如何确保返回的结果是正确的？

回答：通过将每个单词的索引位置存储起来，并在查询时使用双指针法遍历两个索引列表，确保返回的结果始终是两个单词之间的最小距离。测试用例验证了代码在多次查询中的正确性。

问题 7：你能举例说明在面试中如何回答优化问题吗？

回答：在面试中，如果被问到如何优化算法，我会首先分析当前算法的时间复杂度和空间复杂度。预处理方法的查询时间已经是 O(l1 + l2)，这是很高效的。我们可以讨论是否可以进一步减少初始化或查询的复杂度，或者如何在极端情况下优化空间使用，例如通过更紧凑的数据结构来存储索引。

问题 8：如何验证代码的正确性？

回答：通过编写详细的测试用例，涵盖各种可能的输入情况，如列表中有多个相同单词、查询不存在的单词等，确保每个测试用例的结果都符合预期。此外，还可以通过手工推演单词索引的比较过程，验证代码逻辑的正确性。

问题 9：你能解释一下解决“最短单词距离 II”问题的重要性吗？

回答：解决“最短单词距离 II”问题展示了处理多次查询的能力，尤其是在提高查询效率时的技巧。通过掌握这个问题的解决方法，可以提高对线性扫描和预处理优化的理解，并为处理更复杂的查询问题打下基础。

问题 10：在处理大数据集时，算法的性能如何？

回答：预处理阶段的时间复杂度为 O(n)，查询的时间复杂度为 O(l1 + l2)，因此即使在处理大数据集时，查询性能也非常稳定。空间复杂度为 O(n)，预处理索引表在大数据集下的内存使用也保持在合理范围内。

总结

本文详细解读了力扣第244题“最短单词距离 II”，通过使用预处理单词索引位置的方法高效地解决多次查询问题，并提供了详细的解释和模拟面试问答。希望读者通过本文的学习，能够在力扣刷题的过程中更加得心应手。

秒客网

力扣244题详解：最短单词距离 II 的多种解法与模拟面试

测试案例

相关文章