寻找两个有序数组的中位数

时间:2021-07-13 11:14:29

题目描述:
给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。
请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。
你可以假设 nums1 和 nums2 不会同时为空。

示例 1:
  nums1 = [1, 3]
  nums2 = [2]
  则中位数是 2.0

示例 2:
  nums1 = [1, 2]
  nums2 = [3, 4]
  则中位数是 (2 + 3)/2 = 2.5

 

题目解答:
方法1:暴力法
  重新申请一个m + n长的数组,将两个数组的元素按从小到大的顺序放到新数组中,然后直接求中位数,但时间复杂度为O(m + n),不符合题目要求。运行时间也可以到达最快24ms,代码如下。

 1 double findMedianSortedArrays(int* nums1, int nums1Size, int* nums2, int nums2Size) {
 2     int m = nums1Size, n = nums2Size;
 3     int* t = (int*)malloc((m + n) * sizeof(int));
 4     int i = 0, j = 0, index = 0;
 5     int left = 0, right = 0;
 6     double result = 0;
 7     while(index < m + n) {
 8         left = (i < m ? nums1[i] : INT_MAX);
 9         right = (j < n ? nums2[j] : INT_MAX);
10         if(left < right)
11             t[index++] = nums1[i++];
12         else 
13             t[index++] = nums2[j++];
14     }
15     if((m + n) & 1)
16         result =  t[(m + n) / 2];
17     else
18         result = (t[(m + n) / 2] + t[(m + n) / 2 - 1]) / 2.0 ;
19     free(t);
20     return result;
21 }


方法2:二分查找
  易知二分法或者二叉树相关算法的时间复杂度为O(log(n)),而题目要求O(log(m + n)),则可能会用到其中一个,没有二叉树,所以本题可能就是用二分法。问题就是确定子问题。
  根据中位数的定义,中位数的左右两侧数字个数相同,且其左边的数字比其小,右边的数字比其大。构造两个子集,分别是左右子集,假定取nums1中的前i (i ∈[0, m])个放在左子集,nums2的前j (j ∈[0, n])个放在左子集,此时左子集数字个数为i + j,右子集数字个数为m + n - i - j。关系是:

i与j关系

m + n情况 

中位数
i + j = m + n - i - j

m + n 为偶数

中位数为左侧最大值与右侧最小值的平均值, (max_left + min_right) / 2
i + j = m + n + 1 - i - j 

m + n 为奇数

中位数放在左子集,即左侧最大值 max_left

 

  假设我们遍历 i,偶数时为j = (m + n) / 2 - i,奇数时为j = (m + n + 1) / 2 - i,但如果m > n,j会为负数,所以要求m <= n。其实偶数时 j 表示成奇数时的式子也是可以的,因为C语言里边的除法是整除,所以加上1不会影响j的结果。所以j = (m + n + 1) / 2 - i且m <= n。
另一个要求是:

  •   A[i - 1] <= B[j]
  •   B[j - 1] <= A[i]

  令i = (begin + end) / 2:

  •   如果A[i - 1] > B[j],则说明需要减小i,减小i的同时j也会增大,这样A[i - 1]的值就会减小,B[j]的值会增大,向着满足条件的方向靠近。而且因为从i到end之间A是递增的,所以i到end之间的都不符合(i越大,A[i - 1]越大,B[j]越小),故直接将end置为i - 1。
  •   如果B[j - 1] > A[i],则说明需要减小j,减小j的意味着增大i,这样A[i]的值就会增大,B[j + 1]的值会减小,向着满足条件的方向靠近。而且因为从begin到i之间A是递增的,所以begin到i之间的都不符合(i越小,A[i - 1]越小,B[j]越大),故直接将begin置为i + 1。
  •   如果两个条件都满足说明已经遍历到正确的中间位置,进行后续逻辑判断即可。需要注意的是边界情况,在判断时一定要保证数组索引在范围之内,对于不符合的情况,进入到最终的判断逻辑中进行处理。运行时间24ms,代码如下。

 

 1 #define min(a, b) (a < b ? a : b)
 2 #define max(a, b) (a > b ? a : b)
 3 double findMedianSortedArrays(int* nums1, int nums1Size, int* nums2, int nums2Size) {
 4     int m = nums1Size, n = nums2Size;
 5     int t = 0;
 6     if(m > n) {
 7         int* temp = nums1;
 8         nums1 = nums2;
 9         nums2 = temp;
10         t = m;
11         m = n;
12         n = t;
13     }
14     int i = 0, j = 0, left = 0, right = 0;
15     int begin = 0, end = m;
16     t = (m + n + 1) / 2;
17     while(begin <= end) {
18         i = (begin + end) / 2;
19         j = t - i;
20         if(i > 0 && j < n && nums1[i - 1] > nums2[j])
21             end = i - 1;
22         else if(j > 0 && i < m && nums2[j - 1] > nums1[i])
23             begin = i + 1;
24         else {
25             if(i == 0)
26                 left = nums2[j - 1];  
27             else if(j == 0)
28                 left = nums1[i - 1];
29             else
30                 left = max(nums1[i - 1], nums2[j - 1]);
31             if(i == m)
32                 right = nums2[j];
33             else if(j == n)
34                 right = nums1[i];
35             else 
36                 right = min(nums1[i], nums2[j]);
37             if((m + n) & 1)
38                 return left;
39             else
40                 return (left + right) / 2.0;
41         } 
42     }
43     return 0;
44 }

原文地址:

https://blog.csdn.net/hang404/article/details/84786904