基本概念
随机变量:有多种可能的取值的变量
\(P(A):\)事件\(A\)发生的概率
\(E(X):\)随机变量X的期望值,\(E(X)=\Sigma[P(X=i)*i]\)
独立事件:互相不影响的事件,满⾜\(P(AB)=P(A)P(B)\) 前提:\(A,B\);两个随机变量是独立的
对于独立事件,我们有\(E(AB)=E(A)E(B)\)
常用公式
(等比数列求和公式+极限法)
期望的线性性:\(E[X+Y]=E[X]+E[Y]\)
需要注意的是,以上的\(X,Y\)都是随机变量,不是事件,例如两个扔骰子的点数和。
\(\Sigma_{i=0}^n=\frac{1-x^{n+1}}{1-x^n}\),这是等比数列求和公式的变形
前缀和技巧
前缀和技巧是概率期望中很重要的一个技巧
对于离散变量 \(X,P(X=K)=P(X<=K)-P(X<=K-1)\)
例:
1. 有 \(n\) 个随机变量 \(X[1…n]\),每个随机变量都是从 \(1…S\) 中
随机⼀个整数,求 $Max(X[1…n]) $的期望
\(Sol:\)求最大值的期望,根据公式答案为\(\Sigma_{i=1}^{S}P[max=i]i\)
\(P[max=i]\)很难求,但我们可以用前缀和的思想预处理出\(P[max<=i-1]\)和\(P[max<=i]\),相减即可。
\(P[max<=i]=(\frac{i}{S})^i\)
2. 求证:概率为 \(p\) 的事件期望\(\frac{1}{p}\)次后发生
首先这个问题很显然,我们抛硬币的时候期望抛2次得到正面或者反面
用数学方法证明如下
\(Sol:\)使用反向前缀和,设成功次数为\(X\),则\(E[X=i]=E[X>=i]-E[X>=i+1]=(P[X>=i]-P[X>=i+1])*i\)
容易得出\(P[x>=i]=(1-p)^{i-1}\),因为第\(i\)次是有可能成功的
所以\(E[X=i]=[(1-p)^{i-1}-(1-p)^{i}]*i\)
我们展开发现
\(ans=(1-p)^0-(1-p)^1+2*(1-p)^1-2*(1-p)^3+3*(1-p)^3.......=\Sigma_{i=0}^{\infty}(1-p)^i\)
根据等比数列求和公式得到\(ans=\frac{1-(1-q)^{\infty}}{p}\),又因为\(q\in(0,1)\),所以\(ans=\frac{1}{p}\)
得证
概率为 \(p\) 的事件期望\(\frac{1}{p}\)次后发生
这个结论非常重要,之后很有用
另外的小技巧
很多东西都可以看成随机变量或用随机变量表示
例如表达式\(exp>=0\),\(exp=\Sigma_{i=1}^{+\infty}i<=exp\),这个其实很显然,相当于你前面有多少个人再加\(1\)就是你的排名
拿球问题
1.箱子里有 n 个球 1…n,你要从里面拿 m 次球,拿了后放回,求取出的数字之和的期望
\(Sol:\) 每个球都有\(\frac{n}{m}\)的概率被取到,根据期望的线性性质,取出数字之和的期望等于取出数字的期望之,求出每个数字期望,相加即可。
2.箱子里有 n 个球 1…n,你要从里面拿 m 次球,拿了后不放回,求取出的数字之和的期望
\(Sol:\)这个问题相对难想,设\(E(S)\)为答案的期望,设\(E(Xi)\)为第\(i\)项贡献的期望
则\(E(S)=E(\Sigma_{i=1}^{n}Xi)=\Sigma_{i=1}^{n}E(Xi)\)
设\(E(Yi)\)表示\(i\)取出次数的期望,在这个题目中显然\(\in(0,1)\)
为什么要这么设计,因为这是解决拿球问题的通法
那么我们得到\(Xi=Yi*i\),对两边取期望得到\(E(Xi)=E(Yi)*i\)
接下来是重点
期望有点类似平均值的思想,或者说将总和离散了,也就是说\(\Sigma Yi=m\)
那么又因为每个球都是独立平等的,所以每个\(Yi\)一定相等,即\(Yi=\frac{m}{n}\)
以上两句话是这类题的精髓
那么代回去得到\(E(S)=\Sigma_{i=1}{n}\frac{m}{n}*i\),得到的结果和第一问一样,\(ans=\frac{m(n+1)}{2}\)
3.箱子里有 n 个球 1…n,你要从里面拿 m 次球,拿了后以p1 的概率放回,以 p2 的概率放回两个和这个相同的球,求取出的数字之和的期望
\(Sol:\)相信经过了前两问的铺垫,这一问思路已经显而易见了,和第二问完全一样,和这些概率没半点关系,当然你可能会问放回两个相同的球的话,一个球的\(Yi\)可能会增大,但别忘了,这类题的核心是每个球都是独立的平等的,其它球也有等概率放回两个,所以不管放回多少个,每个\(Yi\)还是相等的,平分\(m\),然后只需要和第二问一样做就可以了,显然\(ans=\frac{m(n+1)}{2}\)
游走问题
• 在⼀条 n 个点的链上游走,求从⼀端走到另⼀端的概率
\(Sol:\) 老规矩,设答案为\(S\),那么\(E(S)=\Sigma E(Xi)\),\(E(Xi)\)表示从\(i\)节点走到下一个节点的期望步数,那么我们可以像做\(DP\)列出一个“状态转移方程”,设我们现在要从\(A\)走到下一个点,我们从\(B\)走过来,那么我们可以直接一步过去,也可以往后退再回来走过去,所以我们得出了转移方程
\(E(A)=\frac{1}{2}*1+\frac{1}{2}(1+E(B)+E(A))\)
那么你可能会说,没有考虑往后退几步再往前走等等情况,但其实\(E(B)\)已经被更新完毕了,也就是说\(E(B)\)的值已经包含了所有可能,这所有可能也都包括到\(E(A)\)的路径,可能是往后退\(x\)步,所以我们只用再加上\(E(A)\)即可,这一直让初学的我有些困惑,是很重要的一个思想
将以上式子展开可以得到\(E(A)=E(B)+2\),又因为\(E(1)=1\)(只有一种路径),所以\(E(Xi)\)构成了\(1,3,5,7,9\)的等比数列,我们只需用等比数列求和公式,得出\(ans=(n-1)^2\)。
• 在⼀张 n 个点的完全图上游走,求从一个点走到另一个点的概率
\(Sol:\) 第二个问题很有意思,其实不难
完全图:任意两点之间都有直接连边的图
因为是完全图,所以任意两个点都是平等的,除了出发点\(A\)外还有\(n-1\)个点,还是分两种情况讨论:第一种情况是直接到达\(B\),另一种情况是走到其它的点\(C\),也就是说
\(E(A)=\frac{1}{n-1}*1+E(C)\)
那我们发现问题了,\(A\)和\(C\)应该是平等的,不能因为我们选择了\(A\)就是特殊的,那么我们就将问题变为:每次都有\(\frac{1}{n}\)的概率到达目标点,从\(A\)开始就不停地尝试,这也就和我们之前的推论一样了
概率为 \(p\) 的事件期望\(\frac{1}{p}\)次后发生
好啊,那么答案\(E(S)\)不就是\(n-1\)了吗。
• 在⼀张 2n 个点的完全二分图上游走,求从一个点走到另一个点的概率
• 在⼀张 n 个点的菊花图上游走,求从⼀个点走到另⼀个点的概率
• 在⼀棵 n 个点的树上游走,求从根走到 x 的期望步数
• 构造⼀张200个点的无向图,使得从 S 走到 T 的随机游走期望步数>=1000000