【题意】n种宝物,k关游戏,每关游戏给出一种宝物,可捡可不捡。每种宝物有一个价值(有负数)。每个宝物有前提宝物列表,必须在前面的关卡取得列表宝物才能捡起这个宝物,求期望收益。k<=100,n<=15。
【算法】期望DP+状压DP
【题解】主要需要记录的状态是前缀已有宝物,所以设f[i][S]表示前i关已有宝物列表S的期望收益。
根据全期望公式,依赖于第i+1关的宝物选择:(如果列表符合)
$$f[i][S]=\sum_{i=1}^{n}\frac{1}{n}*Max(f[i+1][S'],f[i+1][S])\ \ ,\ \ S'=S|(1<<(i-1))$$
倒推是因为已知前缀列表S的情况下,很容易判断下一关宝物是否可捡。
#include<cstdio>
#include<algorithm>
#include<cstring>
using namespace std;
const int inf=;
int a[],n,m,v[];
double f[][];
int main()
{
scanf("%d%d",&n,&m);
for(int i=;i<=m;i++)
{
scanf("%d",&v[i]);
int u;scanf("%d",&u);
a[i]=;
while(u!=)
{
a[i]|=(<<(u-));
scanf("%d",&u);
}
}
int maxe=(<<m)-;
for(int i=n-;i>=;i--)
{
for(int j=;j<=maxe;j++)
{
f[i][j]=;
for(int k=;k<=m;k++)
{
if((a[k]&j)==a[k])f[i][j]+=max(f[i+][j],f[i+][j|(<<(k-))]+v[k]);
else f[i][j]+=f[i+][j];
}
f[i][j]/=m;
}
}
printf("%.6lf",f[][]);
return ;
}