这个作者很懒,什么都没留下…
-
原创 如何通俗理解贝叶斯推断与beta分布?
有一枚硬币(不知道它是否公平),假如抛了三次,三次都是“花”: 能够说明它两面都是“花”吗? 1 贝叶斯推断 按照传统的算法,抛了三次得到三次“花”,那么“花”的概率应该是: 但是抛三次实在太少了,完全有可能是运气问题。我们应该怎么办? 托马斯·贝叶斯(1702-1761),18世纪英国数学家,1742年成为英国皇家学会会员。 贝叶斯认为在实验之前,应根据不同的情况对硬...2018-07-19 14:32:45 4595 0 -
原创 如何理解几何分布与指数分布的无记忆性?
在经济学上,有一个概念是沉没成本,大概指的是已经付出的、且不可收回的成本。针对这个概念有一个常见的说法: 这句话的意思是,既然沉没成本不可收回,那么在做选择的时候就不应该考虑它。举一个简单的例子,买票去看电影,放映10分钟你就知道这是一部烂片,那么有两个选项(图片出自沉没成本谬误): 此时这张电影票已经消费了,没有办法收回,购买电影票的钱就是沉没成本。这个时候如果想离开电影院就直接离开...2019-09-29 11:29:09 4391 0 -
原创 概率论发展的转折点:贝特朗悖论
和所有的数学分支类似,概率论的也是经历了从直觉到严格的过程。其中的一个转折点就是贝特朗悖论。 1 古典派 古典派也就是高中时候学的概率论。它的核心哲学思想是:不充分理由原则。 1.1 不充分理由原则 雅各布·伯努利(1654-1705): 提出,如果因为无知,使得我们没有办法判断哪一个结果会比另外一个结果更容易出现,那么应该给予它们相同的概率。比如: 硬币:由于不清楚硬币哪一面...2019-07-31 15:59:51 920 0 -
原创 如何通俗地理解协方差和相关系数?
1 正相关与负相关 1.1 相关性 事物之间可能会有关系,这可以通过数据看出。比如要买房的人越多(下图的城镇化率可以简单理解为进城买房的人数),房价就越高,两者的关系称为正相关 : 城镇化有另外一个反作用,降低出生率。城镇化和出生率之间的关系就是负相关 ,也就是说城镇化率越高、出生率会越低,所以说,“城镇化是最好的避孕药”: 1.2 股票组合 在现实生活中了解相关性是很有用处...2019-06-25 10:13:03 2168 3 -
原创 如何理解指数分布?
1 泊松分布 指数分布和泊松分布息息相关,所以先简单回忆下之前介绍过的泊松分布。公司楼下有家馒头店,每天早上六点到十点营业: 老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据),想从中找到一些规律: 从中可以得到最简单的规律,均值: 这个规律显然不够好,如果把营业时间抽象为一根线段,把这段时间用来表示: 然后把卖出的馒头数画在这根线段上(节约篇幅,只画出周一...2019-05-06 10:34:30 25095 4 -
原创 什么是概率?
1 争论 概率论需要回答的第一个问题就是,什么是概率? 刚接触这门学科的同学可能觉得难以置信,这个问题仍然存在着广泛的争论: 而且这个问题更像是一个哲学问题,而不是数学问题,确实也有不少哲学家参与讨论。 对于概率的定义有几个主流的派别: 频率派 古典派 主观派 了解这些派别对于理解概率论很有帮助,下面来简单介绍一下。 2 频率派 首先来了解下频率派,频...2019-03-12 10:54:48 1716 0 -
原创 概率论的起源
继《线性代数》和《单变量微积分》后,“马同学图解”系列又迎来新的成员 ---- 《概率论与数理统计》,覆盖浙江大学《概率与数理统计》前八章(考研范围),下面是本课程的第一篇文章,欢迎大家试读和购买(微信公众号:马同学高等数学,菜单“图解”中购买)。 1 随机现象 在生活中有些现象是注定的,比如往空中扔一个石头必然会落回地面,这叫作确定性现象 。 也有不确定的现象,大家都见过骰子吧,下面是常...2019-03-05 11:53:18 963 0 -
原创 如何理解无偏估计量?
现实中常常有这样的问题,比如,想知道全体女性的身高均值 ,但是没有办法把每个女性都进行测量,只有抽样一些女性来估计全体女性的身高: 那么根据抽样数据怎么进行推断?什么样的推断方法可以称为“好”? 1 无偏性 比如说我们采样到的女性身高分别为: 那么: 是对 不错的一个估计,为什么?因为它是无偏估计。 首先,真正的全体女性的身高均值 ,我们是不知道,只有上帝才知道,在图中就画...2018-09-15 16:49:04 21406 4 -
原创 如何理解主元分析(PCA)?
主元分析也就是PCA,主要用于数据降维。 1 什么是降维? 比如说有如下的房价数据: 这种一维数据可以直接放在实数轴上: 不过数据还需要处理下,假设房价样本用 表示,那么均值为: 然后以均值 为原点: 以 为原点的意思是,以 为0,那么上述表格的数字就需要修改下: 这个过程称为“中心化”。“中心化”处理的原因是,这些数字后继会参与统计运算,比如求样本方差,中间就包...2018-08-31 12:14:03 5698 3 -
原创 如何理解拉格朗日乘子法和KKT条件?
之前简单介绍了拉格朗日乘子法的基本思路:如何理解拉格朗日乘子法? 本文会继续介绍拉格朗日乘子法的细节,以及对其进行适当的推广(也就是所谓的KKT条件)。 1 无约束下的极值 1.1 直观 根据梯度的意义(参看如何理解梯度)可知,在函数 的极值点梯度为0: 1.2 代数 要求( 的意思是求极小值): 只需解如下方程: 2 单等式约束下的极值 关于这一节,更详细的请参看:...2018-08-18 19:13:39 1917 3 -
原创 为什么正态分布如此常见?
自然界中存在大量的正态分布,比如女性的身高: 图片出自这里。 正态分布的英文名为:Normal Distribution,*翻译为常态分布,可见一斑。可是为什么这么常见呢? 每个人都相信它(正态分布):实验工作者认为它是一个数学定理,数学研究者认为他是一个经验公式。 ----加布里埃尔·李普曼 1 高尔顿钉板 弗朗西斯·高尔顿爵士(1822-1911),查尔斯·达尔文的表弟...2018-08-01 11:40:34 16244 3 -
原创 如何理解最小二乘法?
最小平方法是十九世纪统计学的主题曲。 从许多方面来看, 它之于统计学就相当于十八世纪的微积分之于数学。 ----乔治·斯蒂格勒的《The History of Statistics》 1 日用而不知 来看一个生活中的例子。比如说,有五把尺子: 用它们来分别测量一线段的长度,得到的数值分别为(颜色指不同的尺子): 之所以出现不同的值可能因为: 不同厂家的尺子的生产精度不同 ...2018-07-20 10:14:09 101854 98 -
原创 如何通俗理解泊松分布?
1 甜在心馒头店 公司楼下有家馒头店: 每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应? 老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据): 均值为: 按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,的时间不够卖: 你“甜在心馒头店”又不是...2019-04-12 14:48:40 132872 74 -
原创 如何通俗地理解熵?
熵,是一个热力学的概念。但在历史的发展中,造就了它非常丰富的内涵,进入了很多学科的视野。本文会在数理层面对它进行一个解读,厘清它在逻辑上到底是什么。 1 混乱的熵 很多科普文章中,都提到熵是用来度量混乱的。比如下面这幅动图,单词“Entropy”(熵的英文)可见的时候,熵最小,这个时候最有秩序;而被打乱的时候,熵开始增大,直到最后一片混乱,熵变成最大: 熵之所以很重要,是因为它总结了宇宙...2019-10-08 16:07:42 1109 0