CONTINUOUS RANDOM VARIABLES AND PDFS
连续的随机变量,顾名思义,就是随机变量的取值范围是连续的值,例如汽车的速度,气温。如果我们要利用这些参数来建模,那么就需要引入连续随机变量。
如果随机变量X是连续的,那么它的概率分布函数可以用一个连续的非负函数来表示,这个非负函数称作连续随机变量的概率密度函数(probability density function),而且满足:
如果B是一个连续的区间,那么:
要注意的是任何一个点的概率是等于零的,因为:
所以对与表示概率时的大于等于,小于等于可以等同于大于和小于:
概率密度函数除了非零这个条件外,还有一个条件,根据概率三公理之一的normalization,连续随机变量的总概率等于1:
为了直观的理解连续随机变量的概率是什么,如下图,连续随机变量在某个区间发生的概率等于该变量概率密度函数在该区间下的面积,如图阴影部分:
所以,对于连续随机变量在区间δ发生的概率为:
直观的表示如下:
Expectation
连续随机变量X的期望值公式如下,就是将离散随机变量中的求和改为了积分:
对于随即变量x的函数,其期望值如下:
方差如下:
and:
同理离散随机变量,连续随机变量也符合线性原则:
CUMULATIVE DISTRIBUTION FUNCTIONS
随机变量的累计概率是指,P(X ≤ x)的概率,表示如下:
连续随机变量有以下性质:
-单调非递减性:
-FX(x)趋近于0当x趋近于负无穷,FX(x)趋近于1当x趋近于正无穷。
-如果x是离散随机变量,那么FX(x)呈阶梯状上升,如果x是连续随机变量,那么FX(x)呈连续变化上升状。下图分别为离散和连续随机变量的CDF。
-如果x是离散随机变量,那么它的PMF可以通过CDF相减得到,CDF可以通过对PMF相加得到:
-如果x是连续随机变量,那么它的CDF可以通过对PDF做定积分得到,PDF可以通过对CDF微分得到。
NORMAL RANDOM VARIABLES
正态分布的PDF表示如下:
μ 是随机变量X的期望,即均值,σ 是随机变量X的标准差。所以方差为σ2
其PDF和CDF如下图所示(均值为1,方差为1的正态分布):
当然,正态分布也满足连续随机变量的一般性质:
The Standard Normal Random Variable
如果Y等于:,那么我们可以将不熟悉的Y转变成X再做计算。公式如下:
CONDITIONING ON AN EVENT
类似离散随机变量的条件概率公式,连续随机变量的条件概率如下:
连续随机变量X的期望:
对于X的函数g(x)的期望:
相对于离散函数的total probability,连续随机变量也有:
MULTIPLE CONTINUOUS RANDOM VARIABLES
同样要注意的是f(x,y)是非负的函数。对于一定区间的x,y的概率表示如下:
像一个随机变量的一样,两个随机变量的PDF满足:
为了直观的了解两个随机变量的概念,令:
如果δ无限小,那么双随机变量的概率就相当于是函数f(x,y)在δ2 覆盖下的体积。
连续随机变量的边际概率等于,与离散随机变量的求和对应的是积分:
Expectation
且有:
Conditioning One Random Variable on Another
条件概率也满足normalization的公式:
期望和条件概率的期望如下:
Inference and the Continuous Bayes’ Rule
对于X是离散随机变量,Y是连续随机变量,贝叶斯准则如下:
根据全概率准则,可以得到f(y):
Independence
x与y独立,说明x的发生与否不给y的发生与否提供任何信息,反之亦然,那么:
如果x,y相互独立,那么他们的乘积的期望等于他们期望的乘积:
另外他们的方差也呈线性:
Joint CDFs
反之,通过二次偏微分可以求得其PDF:
More than Two Random Variables
DERIVED DISTRIBUTIONS
对于连续随机变量X的线性函数,有:
对于单调函数:
直观的感受是f(X)乘以dh(y)等于P(X),而f(y)乘以dy也等于P(X).如下图:
最后回顾一下这一章典型的连续型随机变量: