文件名称:典型相关分析-详解python中pyautogui库的最全使用方法
文件大小:3.29MB
文件格式:PDF
更新时间:2024-06-29 04:46:24
R语言
� 338 � 第十章 多元统计分析介绍 说明: 图10.2为典型的聚类树枝型分类图(Cluster Dendrogram), 它是 将两相近(距离最短)的数据向量连接在一起, 然后进一步组合, 直至所有 数据都连接在一起; 函数cuttree( )将数据iris分类结果iris.hc编为三组, 分别以1, 2, 3表示, 保存在iris.id中. 将iris.id与iris中Species作比较 发现, 1应该是setosa类, 2应该是virginica类(因为virginica的个数明显多 于versicolor), 3是versicolor. 从聚类的结果来看, 明显与原始数据有着比 较大的差异. ¥ §10.4 典型相关分析 10.4.1 基本思想 在一元统计分析中, 研究两个随机变量之间的线性相关关系, 可用相关系 数(称为简单相关系数); 研究一个随机变量与多个随机变量之间的线性相关关 系, 可用复相关系数(称为全相关系数). 1936年Hotelling首先将它推广到研究 多个随机变量与多个随机变量之间的相关关系的讨论中, 提出了典型相关分 析. 实际问题中, 两组变量之间具有相关关系的问题很多, 例如几种主要产品 如猪肉、牛肉、鸡蛋的价格(作为第一组变量) 和相应这些产品的销售量(作为 第二组变量)有相关关系; 投资性变量(如劳动者人数、货物周转量、生产建设 投资等)与国民收入变量(如工农业国民收入、运输业国民收入、建筑业国民收 入等)具有相关关系; 患某种疾病的病人的各种症状程度(第一组变量)和用物理 化学方法检验的结果(第二组变量)具有相关关系; 运动员的体力测试指标(如 反复横向跳、纵跳、背力、握力等)与运动能力测试指标(如耐力跑、跳远、投球 等)之间具有相关关系等等. 典型相关分析就是研究两组变量之间相关关系的一种多元统计方法, 设两 组变量用X1, X2, � � � , Xp1及Xp1�1, Xp1�2, � � � , Xp1�p2 表示, 要研究两组变量 的相关关系, 一种方法是分别研究Xi 与Xj pi � 1, � � � , p1 j � p1 � 1, � � � , p1 � p2) 之间的相关关系, 然后列出相关系数表进行分析, 当两组变量较多时, 这 样做法不仅烦琐, 也不易抓住问题的实际; 另一种方法采用类似主成分分 析的做法, 在每一组变量中都选择若干个有代表性的综合指标(变量的线性 组合), 通过研究两组的综合指标之间的关系来反映两组变量之间的相关关 系. 比如猪肉价格和牛肉价格用X1, X2表示, 它们的销售量用X3, X4表示, 研