这道题有点绕,至少思考过程还是比较复杂的。
1.题意是要求寻找一个最优的期望,一想到最优,就会联想到枚举,但怎么枚举?
由题意可以发现可以枚举最后放的那个牌,为什么?因为这样对两边影响最小,只有当你两边都完成后才可以去计算中间那个值,这一步是区间dp的核心思想,将所有情况都归类到枚举的牌位置左右都有区间的情况去计算。
2.如何计算?
这个也是比较麻烦的。首先这个不像一般的概率dp直接用dp[i]表示放完i个牌后的期望,而是要将这个dp[i]分开计算。
具体的公式什么的见点击打开链接
#include <cstdio>
#include <cstring>
#include <cmath>
#include <algorithm>
using namespace std;
const int maxn = 1005;
const double INF = 0x3f3f3f3f3f3f3f;
int N;
double pl, pr, dp[maxn];
double solve () {
double ac = 1 - pl - pr;
for (int i = 1; i <= N; i++) {
dp[i] = INF;
for (int j = 0; j < i; j++) {
double tmp = dp[i-j-1] * pl + dp[j] * pr;
tmp = dp[j] + dp[i-j-1] + (tmp + 1) / ac;
if (tmp < dp[i])
dp[i] = tmp;
}
}
return dp[N];
}
int main () {
while (scanf("%d", &N) == 1 && N) {
scanf("%lf%lf", &pl, &pr);
printf("%.2lf\n", solve());
}
return 0;
}