求子数组最大和的解决方法详解

时间:2022-05-30 06:45:12

题目:输入一个整形数组,数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组,每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。
例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5,和最大的子数组为3, 10, -4, 7, 2,因此输出为该子数组的和18。
如果不考虑时间复杂度,我们可以枚举出所有子数组并求出他们的和。不过非常遗憾的是,由于长度为n的数组有O(n2)个子数组;而且求一个长度为n的数组的和的时间复杂度为O(n)。因此这种思路的时间是O(n3)。
很容易理解,当我们加上一个正数时,和会增加;当我们加上一个负数时,和会减少。如果当前得到的和是个负数,那么这个和在接下来的累加中应该抛弃并重新清零,不然的话这个负数将会减少接下来的和。基于这样的思路,我们可以写出如下代码:

复制代码 代码如下:


/*
// Find the greatest sum of all sub-arrays
// Return value: if the input is valid, return true, otherwise return false
int *pData,              // an array
unsigned int nLength,    // the length of array
int &nGreatestSum        // the greatest sum of all sub-arrays
*/
int start,end;
bool FindGreatestSumOfSubArray(int *pData, unsigned int nLength, int &nGreatestSum)
{
 // if the input is invalid, return false
 if((pData == NULL) || (nLength == 0))
  return false;
 int k=0;
 int nCurSum = nGreatestSum = 0;
 for(unsigned int i = 0; i < nLength; ++i)
 {
  nCurSum += pData[i];
  // if the current sum is negative, discard it
  if(nCurSum < 0)
  {
   nCurSum = 0;
   k = i+1;
  }
  // if a greater sum is found, update the greatest sum
  if(nCurSum > nGreatestSum)
  {
   nGreatestSum = nCurSum;
   start = k;
   end = i;
  }
 }
 // if all data are negative, find the greatest element in the array
 if(nGreatestSum == 0)
 {
  nGreatestSum = pData[0];
  for(unsigned int i = 1; i < nLength; ++i)
  {
   if(pData[i] > nGreatestSum)
   {
    nGreatestSum = pData[i];
    start = end = i;
   }
  }
 }
 return true;
}


讨论:上述代码中有两点值得和大家讨论一下:
• 函数的返回值不是子数组和的最大值,而是一个判断输入是否有效的标志。如果函数返回值的是子数组和的最大值,那么当输入一个空指针是应该返回什么呢?返回0?那这个函数的用户怎么区分输入无效和子数组和的最大值刚好是0这两中情况呢?基于这个考虑,本人认为把子数组和的最大值以引用的方式放到参数列表中,同时让函数返回一个函数是否正常执行的标志。
• 输入有一类特殊情况需要特殊处理。当输入数组中所有整数都是负数时,子数组和的最大值就是数组中的最大元素。
方法二:编程之美2.14

复制代码 代码如下:


/** &nbsp;
求最大子数组和(编程之美2.14,返回下标及首尾不相连)
** author :liuzhiwei&nbsp; &nbsp;
** date&nbsp;&nbsp; :2011-08-17
起始点与结束点下标如何来记录:
由于我要求起始点下标、结束点下标都靠前的子数组,所以我们在动态规划的时候最好从后向前递推,这样dp[i]表示的值就是以下标i为开始的最大子数组的值,那么当dp[i]与dp[j]相同时我们选取i,j中较小的下标作为起点
**/
int maxSum(int *arr, int n, int & start, int & end) &nbsp;
{
&nbsp;&nbsp;&nbsp; int i , temp , dp , max ;
&nbsp;&nbsp; &nbsp;dp = max = arr[n-1];
&nbsp;&nbsp;&nbsp; start = end = n-1;
&nbsp;&nbsp; &nbsp;temp = n-1;
&nbsp;&nbsp;&nbsp; for(i = n - 2 ; i >= 0 ; --i)
&nbsp;&nbsp;&nbsp; {
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if(dp > 0)
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;dp += arr[i];
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;else
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; {
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; dp = arr[i];&nbsp;&nbsp;&nbsp; //抛弃当前子序列
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; temp = i;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //开始新的子序列搜索
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if(dp > max)&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //更新最大子序列
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; {
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; max = dp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; end = temp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; start = i;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //最大和增加,此时的i一定是最右端
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }
&nbsp;&nbsp;&nbsp; }
&nbsp;&nbsp;&nbsp; return max;
}
//特殊测试用例 -10 -1 -4


另外一种从前往后遍历的方法如下:

复制代码 代码如下:


// 需要保存起始点与结束点下标的时候,从前往后遍历也是可以的
int MaxSum(int *a , int n)
{
&nbsp;&nbsp; &nbsp;int tempstart = 0 , sum=0 , max = -1000;
&nbsp;&nbsp; &nbsp;int i , start , end;
&nbsp;&nbsp; &nbsp;start = end = 0;
&nbsp;&nbsp; &nbsp;for(i = 0 ; i < n ; ++i)
&nbsp;&nbsp; &nbsp;{
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;if(sum < 0)
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;{
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;sum = a[i];
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;tempstart = i;
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;}
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;else
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;sum += a[i];
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;if(sum > max)
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;{
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;max = sum;
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;start = tempstart;
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;end = i;
&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;}
&nbsp;&nbsp; &nbsp;}
&nbsp;&nbsp; &nbsp;return max;
}


拓展问题1:
如果认为数组是环形的,即首尾相接(下标n-1的元素后面的元素下标为0),求最大子段和。
解析:

我觉得这个问题要比第一个问题容易,有很多种方法解决。我介绍三种方法,但是其中一种我觉得有问题,但却作为《编程之美》这本书的一道练习答案,也可能是我理解错作者的算法了,一会慢慢讨论。
方法一:
这个问题的最优解一定是以下两种可能。可能一:最优解没有跨过a[n-1]到a[0],即原问题,非环形数组。可能二:最优解跨过a[n-1]到a[0],新问题。
对于第一种情况,我们可以按照简单的动态规划解法求得,设为max1;对于第二种情况,可以将原问题转化为数组的最小子段和问题,再用数组全部元素的和减去最小子段和,那么结果一定是跨过a[n-1]到a[0]情况中最大的子段和,设为max2。最终结果即为max1与max2中较大的那个。
例1:有数组6、-1、-6、8、2
求得max1=10,max2=16,则取较大的max2作为结果。
例2:有数组-6、8、2、6、-1
求得max1=16,max2=15,则取较大的max1作为结果。
可能有些同学会对为什么:数组元素“sum - 最小子段和 = 跨过a[n-1]到a[0]情况中的最大子段和”这一点有些疑问。我们可以这样理解:n个数的和是一定的,那么如果我们在这n个数中找到连续的一段数,并且这段数是所有连续的数的和最小的,那么“sum-最小子段和”的结果一定最大。故求得:跨过a[n-1]到a[0]情况中的最大子段和。

完整代码如下:

复制代码 代码如下:


//环形数组求最大子数组的和
int MaxSum(int *a , int n)
{
 int i , sum , max1 , max2 , dp, min;
 dp = max1 = a[0];
 for(i = 1 ; i < n ; ++i)   //最优解没有跨过a[n-1]到a[0],即原问题,非环形数组
 {
  if(dp < 0)
   dp = a[i];
  else
   dp += a[i];
  if(dp > max1)
   max1 = dp;
 }
 sum = min = dp = a[0];
 for(i = 1 ; i < n ; ++i)   //可以将原问题转化为数组的最小子段和问题,再用数组全部元素的和减去最小子段和,那么结果一定是跨过a[n-1]到a[0]情况中最大的子段和
 {
  if(dp > 0)
   dp = a[i];
  else
   dp += a[i];
  if(dp < min)
   min = dp;
  sum += a[i];
 }
 max2 = sum - min;    //数组全部元素的和减去最小子段和
 return max1 > max2 ? max1 : max2;;     //返回一个较大值
}


第一部分即求第一种情况的最大值max1(用变量Max代替),第二部分中最初tmp为最小子段和,然后tmp值为sum-tmp;最后Max取两者较大的数。
方法二:
方法二将问题转化成另外一个问题:既然一段数的首尾可以相接,那么我们可以将数组复制,并接到自己的后面,然后我们求新数组的最大子数组的和,但这里要限制一个条件,就是最大子数组的长度不可以超过n。这样我们就把问题转化为拓展问题3了,我会在第三部分中介绍。
方法三:
方法三是《编程之美》这本书中介绍的,详细见188页,但是我觉得这种算法是错误的,可能是我理解作者的思路有问题,我将解法抄在下面,并举出一个反例,有兴趣讨论的同学希望能给我留言。
摘自《编程之美》P188:
如果数组(A[0],A[1],A[2],......,A[n-1])首尾相邻,也就是我们允许找到一段数字(A[i],A[i+1],......A[n-1],A[0],A[1],....,A[j]),使其和最大,怎么办?
(1)解没有跨过A[n-1] 到A[0] (原问题)。
(2)解跨过A[n-1]到A[0]。
对于第2种情况,只要找到从A[0]开始和最大的一段(A[0],…,A[j])(0<=j<n),以及以A[n-1]结尾的和最大的一段(A[i],…,A[n-1])(0<=i<n),那么,第2种情况中,和的最大值M_2为:
M_2=A[i]+…+A[n-1]+A[0]+…+A[j]
如果i <= j,则
M_2=A[0]+…+A[n-1]
否则
M_2=A[0]+…+A[j]+A[i]+…+A[n-1]
最后,再取两种情况的最大值就可以了,求解跨过A[n-1]到A[0]的情况只需要遍历数组一次,故总时间复杂度为O(N)+O(N)=O(N)。
解析:
分为两种情况讨论是没有问题的,但是对于第2种情况的解法我认为是错误的,反例:
求5个元素的数组6,-1,-6,8,2的最大子数组和:M_1为10,但是如果利用上面的方法,M_2求得的结果为9,因为从A[0]开始和最大的一段即为A[0],…,A[n-1]为9,以A[n-1]结尾的和最大的一段(A[i],…,A[n-1])为A[n-1],由于这两段有相交,故M_2= A[0]+…+A[n-1]。
最终结果为9,取两种情况较大的,那么结果为10。但是正确结果明显为16。
出现这种结果的原因:从A[0]开始和最大的一段虽然求的没有错,但是我们希望求得的结果并非是这一段,我们希望求得A[0]这一段,这样就不会出现两段相交的情况。
在第二部分中,我分析了两个拓展问题,后面两个拓展问题我会在第三部分中分析。
如果我上面有写的不对的地方或者你有更好的方法,希望能提出来,互相学习嘛。
拓展问题2:
有一个整数数列,其中有负数、正数, 其中连续的几个数求和,求和的绝对值最大的数字串。
分析
思路
最大子矩阵和

复制代码 代码如下:


#include <iostream>
#include <cstdio>
using namespace std;
#include <memory.h>
int a[102][102];
int maxSubArray(int *arr, int len)       //最大子序列和
{
 int i,sum=arr[0],b=0;
 for(i=0;i<len;++i)
 {
  if(b>0)
   b+=arr[i];
  else
   b=arr[i];
  if(b>sum)
   sum=b;
 }
 return sum;
}
int maxSubMatrix(int n, int m,int array[102][102])
{
 int i,j,h,max,sum=-100000;
 int b[102];
 for(i=0;i<n;i++)
 {
  memset(b,0,sizeof(b));       //初始化b[]
  for(j=i;j<n;j++)             //把第i行到第j行相加,对每一次相加求出最大值
  {
   for(h=0;h<m;h++)
   {
    b[h]+=array[j][h];    //二维数组压缩成一维数组,然后求最大子序列和
   }
   max=maxSubArray(b,h);
   if(max>sum)
    sum=max;
  }
 }
 return sum;
}
int main(void)
{
 int n,i,j;
 while(scanf("%d",&n)!=EOF)
 {

  for(i=0;i<n;i++)
  {
   for(j=0;j<n;j++)
    scanf("%d",&a[i][j]);
  }
  printf("%d\n",maxSubMatrix(n,n,a));
 }
 return 0;
}