2.x ESL第二章习题2.5

题目

2.x ESL第二章习题2.5

描述

$y_i=x_i^T\beta+\epsilon_i$
$\epsilon_i\sim N(0,\sigma^2)$
已有训练集$\tau$，其中$X:n\times p,y:n\times 1,\epsilon:n\times 1$
使用最小二乘得到$\hat{\beta}=\left(X^TX\right)^{-1}X^Ty$
$y=X\beta+\epsilon$
需要预测点$x_0$的値$y_0$

题2.7

2.x ESL第二章习题2.5

准备
- $E(y_0)=E(x_0^T\beta+\epsilon_0)=E(x_0^T\beta)+E(\epsilon_0)=x_0^T\beta+0$
- $E[\left(y_0-E(y_0)\right)^2]=E[\left(x_0^T\beta+\epsilon_0-x_0^T\beta\right)^2]=E[\epsilon_0^2]=\sigma^2$
- $\hat{y_0}=x_0^T\hat{\beta}=x_0^T\left(X^TX\right)^{-1}X^T\left(X\beta+\epsilon\right)\\ \ =x_0^T\left(X^TX\right)^{-1}X^TX\beta+x_0^T\left(X^TX\right)^{-1}X^T\epsilon\\ \ =x_0^T\beta+x_0^T\left(X^TX\right)^{-1}X^T\epsilon\\ \ =x_0^T\beta+\sum_i a_i\epsilon_i$ <br>其中$a_i=\left[x_0^T\left(X^TX\right)^{-1}X^T\right]_i$
- $E(\hat{y_0})=E(x_0^T\beta+\sum_i a_i\epsilon_i)=x_0^T\beta+\sum_i E(a_i)E(\epsilon_i)=x_0^T\beta$
  这里由于$X$由某分布产生，所以$E(a_i)$不是简单常数
题解

$EPE(x_0)=\int\int\left(y_0-\hat{y_0}\right)^2p(y_0)p(\hat{y_0})\mathrm{d} y_0\mathrm{d}\hat{y_0}\\ \ =\int\int\left[\hat{y_0}-E(\hat{y_0})+E(\hat{y_0})-y_0\right]^2p(y_0)p(\hat{y_0})\mathrm{d} y_0\mathrm{d}\hat{y_0}\\ \ =\int\left[\hat{y_0}-E(\hat{y_0})\right]^2p(\hat{y_0})\mathrm{d}\hat{y_0}+\int\int\left[E(\hat{y_0})-y_0\right]^2p(y_0)p(\hat{y_0})\mathrm{d} y_0\mathrm{d}\hat{y_0}+2\times 0\\ \ ={Var}_\tau(\hat{y_0})+\int\int\left[y_0-E(y_0)+E(y_0)-E(\hat{y_0})\right]^2p(y_0)p(\hat{y_0})\mathrm{d} y_0\mathrm{d}\hat{y_0}\\ \ ={Var}_\tau(\hat{y_0})+\int\left[y_0-E(y_0)\right]^2p(y_0)\mathrm{d} y_0+\left[E(y_0)-E(\hat{y_0}\right]^2+2\times 0\\ \ ={Var}_\tau(\hat{y_0})+\sigma^2+0^2$

${Var}_\tau(\hat{y_0})=E\left[\hat{y_0}-E(\hat{y_0})\right]^2\\ \ =E\left[x_0^T\beta+\sum_i a_i\epsilon_i-x_0^T\beta\right]^2=E\left[\sum_i\sum_j a_ia_j\epsilon_i\epsilon_j\right]\\ \ =E\left[ \sum_i a_i^2\epsilon_i^2 \right]+E\left[\sum_i\sum_{j:j\neq i} a_ia_j\epsilon_i\epsilon_j\right]\\ \ =\sum_iE(a_i^2)E(\epsilon_i^2)+\sum_i\sum_{j:j\neq i} E(a_ia_j)E(\epsilon_i)E(\epsilon_j)\\ \ =\sigma^2E(\sum_i a_i^2)+0=\sigma^2E\left(x_0^T\left(X^TX\right)^{-1}X^TX\left(X^TX\right)^{-1}x_0\right)\\ \ =\sigma^2E\left(x_0^T\left(X^TX\right)^{-1}x_0\right)$

题2.8

2.x ESL第二章习题2.5

准备
- 假设$E(x^{(i)})=0,i=1...p$，即每个维度的期望都为0
  
  $X^TX$得到$p\times p$的矩阵
  
  $X_{:i}$表示$X$的第$i$列，即训练集输入部分的第i个维度
  
  $X_{:i}^TX_{:i}=\sum_j^N {x_j^{(i)}}^2=N\ \frac{1}{N}\sum_j^N (x_j^{(i)}-E(x^{(i)}))^2=N\hat{Var}(x^{(i)})$得到对角元素
  
  $X_{:i}^TX_{:j}=\sum_t^N x_t^{(i)}x_t^{(j)} = N\ \frac{1}{N} (x_t^{(i)}-E(x^{(i)}))(x_t^{(j)}-E(x^{(j)}))=N\hat{Cov}(x^{(i)},x^{(j)})$
  
  当$N\to \infty $，$X^TX \to NCov(x)$
- $K:p\times p,b:p\times 1$
  
  $trace Kbb^T=\sum_i {[Kbb^T]}_{ii}=\sum_i \sum_j K_{ij}{[bb^T]}_{ji}=\sum_i \sum_j K_{ij}b_ib_j$
  
  $b^TKb=\sum_i {b^T}_{1i}{[Kb]}_{i1}=\sum_i \sum_j b_iK_{ij}b_j$
  
  $trace Kbb^T=b^TKb$
题解

$E\left(x_0^T\left(X^TX\right)^{-1}x_0\right)\sim E\left(x_0^T{Cov(x)}^{-1}x_0\right)/N\\ \ =E\left(trace {Cov(x)}^{-1}x_0x_0^T\right)/N\\ \ =trace {Cov(x)}^{-1}E(x_0x_0^T)/N=trace {Cov(x)}^{-1}Cov(x)/N\\ \ =trace I/N=p/N$

$EPE(x_0)=(p/N+1)\sigma^2$

2.x ESL第二章习题2.5的更多相关文章

2&period;x ESL第二章习题 2&period;8
题目代码 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 3 ...
2&period;x ESL第二章习题2&period;4
题目准备 $x_i\sim N(0,1)$,有$\sum_i^n x_i^2 \sim \chi^2(n)$其中$n$称为*度,卡方分布的均值即其*度 $x_i\sim N(\mu_i,\sig ...
统计学习导论：基于R应用——第二章习题
目前在看统计学习导论:基于R应用,觉得这本书非常适合入门,打算把课后习题全部做一遍,记录在此博客中. 第二章习题 1. (a) 当样本量n非常大,预测变量数p很小时,这样容易欠拟合,所以一个光滑度更高 ...
Python编程快速上手-让繁琐工作自动化-第二章习题及其答案
Python编程快速上手-让繁琐工作自动化-第二章习题及其答案 1.布尔数据类型的两个值是什么?如何拼写? 答:True和False,使用大写的T和大写的F,其他字母是小写. 2.3个布尔操作符是什么 ...
最小正子序列（序列之和最小，同时满足和值要最小）(数据结构与算法分析——C语言描述第二章习题2&period;12第二问)
#include "stdio.h" #include "stdlib.h" #define random(x) (rand()%x) void creat_a ...
中级Perl第二章习题
2. 4. 1. 习题1 [15 分钟] 写一个程序从命令行取一个文件清单, 然后用grep 把那些文件大小在1000 字节以内的文件找出来.用map 把这个清单里的每个字串前加四个空格并在字串后面 ...
算法竞赛入门经典第二版第二章习题-(练习Java和C++语法)
习题2-1水仙花数(daffodil) 输出1000-999中所有的水仙花数.若三位数ABC满足ABC = A3+B3+C3,则称其为水仙花数. Java: package suanfa; publi ...
《Python自然语言处理》第二章-习题解答-练习6
问题描述:在比较词表的讨论中,创建一个对象叫做translate,通过它你可以使用德语和意大利语词汇查找对应的英语词汇.这种方法可能会出现什么问题,你能提出一个办法来避免这个问题吗? 虽然这是一道初级 ...
Python《学习手册：第二章-习题》
什么是Python解释器? Python解释器是运行Python程序的程序. 什么是源代码? 源代码是为程序所写的语句:它包括文本文件(通常以.py为文件名结尾)的文件. 什么是字节码? 字节码是Py ...

随机推荐

12月18日Smarty文件缓存
缓存做缓存的目的是为了让程序运行起来更加迅速.因为如果程序访问数据库时数据量较大,执行起来会比较慢.而且每一次刷新页面都会访问依稀数据库,然后再把数据显示在页面上. 设置缓存也有一个缺点,那就是缓存 ...
搭建高可用mongodb集群（四）—— 分片
按照上一节中<搭建高可用mongodb集群(三)—— 深入副本集>搭建后还有两个问题没有解决: 从节点每个上面的数据都是对数据库全量拷贝,从节点压力会不会过大? 数据压力大到机器支撑不了的 ...
Jmeter之JDBC请求（四）
我们常用的Jmeter中的功能又HTTP请求.JDBC Request.SOAP/XML -RPC Request,这3个请求, 现在就为大家介绍下什么是JDBC请求首先,大家右键点击“测试计划” ...
四则运算 Day3
总结篇一开始看到自己的成绩是接近及格线的时候,我的内心是崩溃的,就差辣么一点点..但是感谢老师给了这么一个补交作业的机会.在参考博客园相关四则运算题目后,做了一个适用小学一二年级使用的简单的四则运算 ...
hdu-acm steps Monkey and Banana
这道题是典型的dp题.首先是数据的处理上,因为每个长方体的3条不同长度的棱都可以作为高,因此一个长方体可以看成3个不同的长方体.从而将数据扩展为3*n,然后将所有的长方体以长度为第一排序条件,宽度为第 ...
Asp&period;Net生命周期系列二
在上回书开始的时候我们提到博客园的IIS看了一眼我的请求后就直接交给ASP.NET去处理了,并且要求ASP.NET处理完之后返回HTML以供展示. 那么我们不仅要问: 1, IIS肯定是没有眼睛 ...
C程序第二章节：算法
1.主要讲了:算法,3种基本结构化的算法(顺序,选择,循环结构),N-S流程图表示算法,伪代码表示算法. 2.输入10个数,输出其中最大的一个数. #include <stdio.h>in ...
C语言编程时常犯十八个错误
C语言的最大特点是:功能强.使用方便灵活.C编译的程序对语法检查并不象其它高级语言那么严格,这就给编程人员留下“灵活的余地”,但还是由于这个灵活给程序的调试带来了许多不便,尤其对初学C语言的人来说,经 ...
RocketMQ-消费重试机制
介绍: RocketMQ的消息重试及时分为两种,一种是Producer端重试,一种是Consume端重试. 1.Producer端重试 : 1.1消息发没发成功,默认情况下是3次重试. 2.Consu ...
2018年 js 简易控制滚动条滚动的简单方法
首先是es2015 的新api Element.scrollIntoView() // 滚动到最上方等同于 dom.scrollIntoView(true) Element.scrollIntoVi ...

2.x ESL第二章习题2.5

题目

描述

题2.7

准备

题解

题2.8

准备

题解

2.x ESL第二章习题2.5的更多相关文章

随机推荐

相关文章