文件名称:dsc-introduction-to-sampling-nyc-ds-071519
文件大小:45KB
文件格式:ZIP
更新时间:2024-05-08 09:58:37
JupyterNotebook
采样介绍 介绍 如果有的话,我们很少能够对感兴趣的人群进行全面调查。 同样,我们经常会处理丢失的数据。 无论是估计哮喘发生率,鱼类种群,每日温度,材料量,风险,制造缺陷还是任何其他未知或大规模的量度方法,我们都不太可能获得有关该系统的完整信息。 因此,我们会尽力做到这一点,即抽取样本,并使用这些样本来估计整个样本所对应的度量值,然后从中抽取样本。 这些总体参数的估计称为点估计。 有趣的是,总体参数的点估计具有可预测的行为,因为点估计本身将形成特定的概率分布。 例如,我们可能想知道有关人口年龄的信息。 我们可能要估计的一个参数是人口的平均年龄。 一旦我们进行了抽样,便可以获取该样本的平均年龄,这将成为整个人群的平均年龄的点估计。 如果我们继续从总体中抽取更多样本,则每个样本的平均年龄将开始形成正态分布! 这个有趣的事实使我们能够应用一些逻辑并计算围绕点估计值的置信区间,这样我们不仅可以对参数
【文件预览】:
dsc-introduction-to-sampling-nyc-ds-071519-master
----index_files()
--------index_12_0.png(6KB)
----titanic.csv(64KB)
----CONTRIBUTING.md(2KB)
----index.ipynb(20KB)
----LICENSE.md(1KB)
----.gitignore(64B)
----.learn(87B)
----README.md(7KB)