没想到这种多个状态转移的还能用上斜率优化……学到了……
首先我们可以发现,切的顺序对最终答案是没有影响的
比方说有一个序列$abc$,每一个字母都代表几个数字,那么先切$ab$再切$bc$,得分是$ab+bc+ac$,而如果先切$bc$再切$ab$,得分也是$ab+bc+ac$,不难看出得分是一样的
那么我们可以考虑一下转移方程$$dp[a][i]=max\{dp[a-1][j]+sum[j]*(sum[i]-sum[j])\}$$
其中$a$表示切几刀,$sum$表示前缀和
然后发现空间复杂度太大了,又发现每一刀的状态只与前一刀有关,那么可以用滚动数组优化
然后上面的转移是$O(n^2k)$的,那么考虑用斜率优化优化到$O(nk)$(以下省略dp的第一维)
我们假设$j>k$且$j$比$k$更优,则有$$dp[j]+sum[j]*(sum[i]-sum[j])>dp[k]+sum[k]*(sum[i]-sum[k])$$
$$(dp[j]-sum[j]^2)-(dp[k]-sum[k]^2)>sum[i]*sum[k]-sum[i]*sum[j]$$
因为$sum[k]-sum[j]$是负数,所以除的时候不等式要变号
$$\frac{(dp[j]-sum[j]^2)-(dp[k]-sum[k]^2)}{sum[k]-sum[j]}<sum[i]$$
然后直接上斜率优化
注意特判$sum[k]-sum[j]=0$,随便返回极大值或极小值
顺便注意记录路径
//minamoto
#include<iostream>
#include<cstdio>
#define ll long long
using namespace std;
#define getc() (p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++)
char buf[<<],*p1=buf,*p2=buf;
inline int read(){
#define num ch-'0'
char ch;bool flag=;int res;
while(!isdigit(ch=getc()))
(ch=='-')&&(flag=true);
for(res=num;isdigit(ch=getc());res=res*+num);
(flag)&&(res=-res);
#undef num
return res;
}
char sr[<<],z[];int C=-,Z;
inline void Ot(){fwrite(sr,,C+,stdout),C=-;}
inline void print(int x){
if(C><<)Ot();if(x<)sr[++C]=,x=-x;
while(z[++Z]=x%+,x/=);
while(sr[++C]=z[Z],--Z);sr[++C]=' ';
}
const int N=;
int to[][N],q[N],n,k,h,t,r;
ll sum[N],dp[][N];
inline double slope(int j,int k){
if(sum[j]==sum[k]) return 1e18;
return ((dp[r^][j]-sum[j]*sum[j])-(dp[r^][k]-sum[k]*sum[k]))*1.0/(sum[k]-sum[j]);
}
int main(){
//freopen("testdata.in","r",stdin);
n=read(),k=read();
for(int i=;i<=n;++i) sum[i]=read()+sum[i-];
for(int a=;a<=k;++a){
r=a&;
h=t=;
for(int i=;i<=n;++i){
while(h<t&&slope(q[h],q[h+])<sum[i]) ++h;
to[a][i]=q[h];
dp[r][i]=dp[r^][q[h]]+sum[q[h]]*(sum[i]-sum[q[h]]);
while(h<t&&slope(q[t],q[t-])>slope(q[t-],i)) --t;q[++t]=i;
}
}
printf("%lld\n",dp[k&][n]);
for(int i=k,u=n;i;--i){
u=to[i][u];
print(u);
}
Ot();
return ;
}