(翻了翻其他的题解,觉得它们没讲清楚这个策略的正确性)
Problem
题意概要:给定一个长为\(n\)的序列,可以选择以\(\frac 12\)的概率进行左右移动,也可以结束并得到当前位置上的收益,求从每个位置开始时使用最优策略的最大期望收益是多少
\(n\leq 10^5\)
Solution
关键在于需要考虑当前是选择移动还是直接结束。一个很明了的观点:如果当前移动后的收益期望比当前位置的收益大,那么会选择移动;否则选择直接停止。直接停止的贡献已经知道,那么要求的就是当前点选择移动操作后的收益期望
有一个结论:在长度为\(L\)的数轴上的位置\(x\)处,每次进行左右移动(左右概率都为\(\frac 12\)),若到达\(0\)或\(L\)即停止,则到达\(0\)停止的概率为\(\frac {L-x}L\),到达\(L\)停止的概率为\(\frac xL\)
关于这个结论的证明,考虑设在 \(i\) 开始,到\(L\)停止的概率为\(f_i\),由题可得\(f_i=\frac {f_{i-1}+f_{i+1}}2\),不难发现这个方程是等差数列的描述,又由\(f_0=0,f_L=1\)可得\(f_i=\frac xL\),即可得到上面的结论
这个结论的用处后面再说
假设我们已知一些节点移动的期望收益比当前点停止的收益低,即如果进行随机游走,一旦到达这些点,一个极端聪明的人是绝不会继续移动的,设这些点为停止点
会发现,如果从 \(i\) 出发进行移动,那么移动的期望收益一定是由 \(i\) 往前数第一个停止点和往后数第一个停止点贡献的
不妨设为 \(a\) 和 \(b\),由我们之前的结论可以得到到达 \(a\) 停止的概率为\(\frac {b-i}{b-a}\),到达 \(b\) 停止的概率为\(\frac {i-a}{b-a}\),由期望公式可得从 \(i\) 出发进行随机移动的期望收益为 \(E=v_a\cdot \frac {b-i}{b-a}+v_b\cdot \frac {i-a}{b-a}\),比划一下会发现这是满足物理里的杠杆模型的
现在我们得到了一个优秀的做法,就是对于每个点,找到其前后的第一个停止点,得到其移动的期望收益然后与自己的停止收益取最大值
但如何求出所有的停止点呢?
进一步,画个图可知,设 \(a\) 坐标为 \((a,v_a)\),\(b\) 坐标为 \((b,v_b)\),则从 \(i\) 出发进行移动的期望收益是 \(a,b\) 所连线段与直线\(x=i\)的交点纵坐标,所有的停止点会满足在\(x=i\)时,\(v_i\)要比这条线段要高
不难发现若将所有停止点 \((i,v_i)\)画出来一定成为一个凸包,反证法证明:若存在一个停止点在凸包内,则这个点的移动期望比停止期望大,也就是说这并不是一个停止点,与假设相悖,得证
所以为了得到所有的停止点,只要对所有的\((i,v_i)\)求个凸包即可
证明真有趣
Code
#include <bits/stdc++.h>
typedef long long ll;
inline void read(ll&x){
char c11=getchar();x=0;while(!isdigit(c11))c11=getchar();
while(isdigit(c11))x=x*10+c11-'0',c11=getchar();
}
const int N=101000,bs=1e5;
int n,tp;
struct vec{
int x;ll y;
inline vec(){}
inline vec(const int&X,const ll&Y):x(X),y(Y){}
friend inline vec operator - (const vec&A,const vec&B) {return vec(A.x-B.x,A.y-B.y);}
friend inline ll operator * (const vec&A,const vec&B) {return A.x*B.y-A.y*B.x;}
}p,st[N];
void push(vec p){
while(tp&&(p-st[tp])*(st[tp]-st[tp-1])<=0)--tp;
st[++tp]=p;
}
int main(){
scanf("%d",&n);vec p;
for(int i=1;i<=n;++i)p.x=i,read(p.y),p.y*=bs,push(p);
push(vec(n+1,0));
for(int i=1,j=0;i<=n;++i){
while(j<tp&&st[j].x<i)++j;
if(st[j].x==i)printf("%lld\n",st[j].y);
else printf("%lld\n",((st[j].x-i)*st[j-1].y+(i-st[j-1].x)*st[j].y)/(st[j].x-st[j-1].x));
}return 0;
}