【BZOJ】1076 [SCOI2008]奖励关期望DP+状压DP

【题意】n种宝物，k关游戏，每关游戏给出一种宝物，可捡可不捡。每种宝物有一个价值（有负数）。每个宝物有前提宝物列表，必须在前面的关卡取得列表宝物才能捡起这个宝物，求期望收益。k<=100,n<=15。

【算法】期望DP+状压DP

【题解】主要需要记录的状态是前缀已有宝物，所以设f[i][S]表示前i关已有宝物列表S的期望收益。

根据全期望公式，依赖于第i+1关的宝物选择：（如果列表符合）

$$f[i][S]=\sum_{i=1}^{n}\frac{1}{n}*Max(f[i+1][S'],f[i+1][S])\ \ ,\ \ S'=S|(1<<(i-1))$$

倒推是因为已知前缀列表S的情况下，很容易判断下一关宝物是否可捡。

#include<cstdio>

#include<algorithm>

#include<cstring>

using namespace std;

const int inf=;

int a[],n,m,v[];

double f[][];

int main()

{

    scanf("%d%d",&n,&m);

    for(int i=;i<=m;i++)

    {

        scanf("%d",&v[i]);

        int u;scanf("%d",&u);

        a[i]=;

        while(u!=)

        {

            a[i]|=(<<(u-));

            scanf("%d",&u);

        }

    }

    int maxe=(<<m)-;

    for(int i=n-;i>=;i--)

    {

        for(int j=;j<=maxe;j++)

        {

            f[i][j]=;

            for(int k=;k<=m;k++)

            {

                if((a[k]&j)==a[k])f[i][j]+=max(f[i+][j],f[i+][j|(<<(k-))]+v[k]);

                else f[i][j]+=f[i+][j];

            }

            f[i][j]/=m;

        }

    }

    printf("%.6lf",f[][]);

    return ;

}

秒客网

【BZOJ】1076 [SCOI2008]奖励关期望DP+状压DP

相关文章

【BZOJ】1076 [SCOI2008]奖励关 期望DP+状压DP

相关文章

【BZOJ】1076 [SCOI2008]奖励关期望DP+状压DP