卡方检验
- 分类变量的差异性检验即卡方检验与分类变量的相关性检验的联系与区别
- 联系:在很多类型的相关性检验中会用到卡方值,如无序非配对资料中的pearson列联系数和phi系数
- 区别:差异性检验是一个变量的不同分组的比较,而相关性检验是关于两个变量的计算
卡方检验基本结构
-
Proc freq <选项>;
-
Table 列*行/<选项>;
-
chisq
-
可输出Pearson χ2检验、似然比检验、Mantel-Haenszel检验、phi系数、列联系数等值。
四格表还可输出连续校正χ2检验和Fisher确切检验
-
-
trend
- 输出Cochran-Armitage趋势检验结果,仅限于2×C表或R×2表
-
measures
- 计算一系列关联性指标及其渐近标准误,如Pearson相关系数、Spearman相关系数、Kendalls’tau-b值、Gamma系数等
-
agree
- 用于配对的卡方检验
-
下表格皆为table选项
-
-nopercent 不显示总数的百分比 norow 不显示行合计的百分比 nocol 不显示列合计的百分比 expected 显示理论数 fisher 输出Fisher确切概率 binomial 输出单组的百分比及其可信区间
-
-
Test 统计量关键字;
- kappa
- 对一致性系数(Kappa系数)进行统计学检验
- measures
- 对tabled语句中measures选项输出的所有关联系数进行检验
- pcorr
- 对Pearson相关系数进行检验
- scorr
- 对Spearman相关系数进行检验
- kappa
-
Weight 权重变量;
- 当数据为手动输入时,需要利用weight对变量而不是数据集进行赋权
-
By 分层变量;
-
Run;
卡方趋势检验
-
卡方趋势检验是一种比较粗糙的检验方法
-
在对趋势的程度进行定义时,可选择组中值,也可以选择1、2、3、、、这样的do循环可以做出的字符
-
上述两种趋势程度进行的赋值,根据所赋值不同所得出的结果也不相同,所以在计算以及得出的结果要注意
-
工龄 | < 1 | 1 | 2 | 3 | 4 | 6 |
---|---|---|---|---|---|---|
患病人数 | 1 | 7 | 25 | 30 | 32 | 28 |
未患病人数 | 53 | 113 | 230 | 154 | 137 | 110 |
data aa;
do a = 1 to 2;
do b = 1 to 6;
input f@@;
output;
end;
end;
cards;
1 7 25 30 32 28
53 113 230 154 137 110
;
run;
proc freq;
weight f;
table a*b/trend;
run;
SAS小知识点
- do循环
- 无论有几个do循环只有一个output
- 有几个do循环就有几个end
- 多个do循环共用时,第一个do循环一般是代表的是列变量即分组变量,第二个do是性质变量。
- 此规定与table a*b类似,即a代表的分组,b代表的是变量的性质,如发病率等