文件名称:机器学习的统计基础-mbse-overview-incose-30-july-2015
文件大小:5.71MB
文件格式:PDF
更新时间:2024-06-29 10:29:08
数据挖掘
第一章 机器学习的统计基础 1.1 概率论 1.概率论基本概念 样本空间 我们将随机实验 E 的一切可能基本结果组成的集合称为 E 的样本空间,记为 S。样本空间的元素,即 E 的每一个可能的结果,称为样本点。样本空间又叫基本事件空间。 例:拍拍贷用户的学历 S={‘研究生或以上’,‘本科’,‘大专’,‘高中’,‘中专’,‘初中及以下’},A={‘研 究生或以上’,‘本科’,‘大专’} 事件 事件 A 是样本空间的子集,可分为四种类型 空事件: 样本空间的空子集; 原子事件: 仅包含一个元素的样本空间; 混合事件: 包含多个元素的样本空间; 样本空间本身也是一个事件. 集合 概率论定义 概率用来描述一件事的不确定性。假设 A 是投硬币的一个结果(比如正面朝上),如果重复投硬币很 多次,直到 A 出现的机会逼近一个极限 p。那么可以说出现 A 的概率是 p 对于事件 A 和 B,联合概率 Pr(AB)表示事件 A 和 B 同时发生的概率。 概率定律 事件的概率: P(A) 满足: P(A) 0 ;P(S) = 1;对于一连串的互斥事件: i ii i APAP )()( S A