SAS数据步与过程步，数据步语句

SAS数据步与过程步，数据步语句
http://www.biostatistic.net/thread-2045-1-1.html ---转载---原文作者：biostar
(出处: 生物统计家园)

数据步与数据步语句

１．数据步基本概念
数据步是产生数据集的一组语句。一个数据步可以建立一个或多个数据集。在一份程序中可以有多个数据步。数据步程序还可以对已建立了的数据集进行修改和产生输出。

２．程序变量与数据集变量
ＳＡＳ变量有程序变量与数据集变量。数据集的列也叫变量。

３.　数据步的三种基本结构
  （１）数据源是ＤＯＳ数据文件
如果数据源是一个ＤＯＳ的ＡＳＣｌｌ码数据文件存储于磁盘来建立数据集，其数据步程序具有如下格式：
ＤＡＴＡ语句；
ＩＮＦＩＬＥ语句；
ＩＮＰＵＴ语句；
［其它数据步语句；］
；
第一行“ＤＡＴＡ语句；”告诉系统数据步开始，并给出将要产生的数据集名字及其有关信息。
第二行“ＩＮＦＩＬＥ语句；”中给出数据源文件的文件名等，执行该语句后，指定的ＤＯＳ文件被打开。
第三行“ＩＮＰＵＴ语句；”给出将要从打开的文件中读取值的程序变量名及其信息。
第四行“［其它数据步语句；］”是指此处还可以写其它允许使用ＳＡＳ数据步语句，此行的内容是可选的。一般情况下，由前三行就可以构成一个数据步。
最后一行是一个分号，它是本数据步结束的信息。
（２）数据源在作业流中
格式：
  ＤＡＴＡ语句；
ＩＮＰＵＴ语句；
［其它数据步语句；］
ＣＡＲＤＳ；
；
　　“输入数据行”（每一行中的数据用一个或多个空格分隔，每一行的行末无标点。通常，一行数据是客观实体的一个观测的原始数据。有*型、列型、格式化型）

  （３）数据源是已存在的数据集
　利用已经建立了的数据集中的数据来产生新的数据集。

格式：
      ＦＩＬＥＮＡＭＥ语句
   ＩＮＦＩＬＥ语句
；
　　这个语句给出完整的ＤＯＳ文件标识包括驱动器名、目录名、文件名和扩展名，
      一个文件标识可以唯一指定一个文件。

4、数据步程序控制语句

（1）ＧＯＴＯ转向语句

格式：
　　　　ＧＯＴ标号；

执行该语句后，程序控制转向程序中以ＧＯＴＯ后的而不是执行ＧＯＴＯ语句的下一行。
（2）ＳＴＯP 停止执行语句
      例：
      ＤＡＴＡａ；
      ＩＮＰＵＴＸ＠＠；
      ＩＦｘ＜０ＴＨＥＮＳＴ O Ｐ；
      ＣＡＲＤＳ；
      P R O C?ＰＲＩＮＴ；

（3） if 条件语句
格式：
　　　　ＩＦ表达式ＴＨＥＮ
当表达式的值为真时执行其后的ＳＡＳ语句。

（4）ＲＵＮ；
　　执行前面的语句。

（5）多向选择语句
   格式：
      ＳＥＬＥＣＴ［（表达式０）」；
      ＷＨＥＮ（表达式1）语句１；
      ＷＨＥＮ（表达式２）语句２；
      ......

            ＷＨＥＮ（表达式ｎ）语句ｎ
      ......


（6）ＤＥＬＥＴＥ语句
      格式：
　　　　ＤＥＬＥＴＥ；
   语句的功能是当执行了ＤＥＬＥＴＥ语句后，该语句之后的语句将不被执行并且当前观察不送入数据集，而返回数据步的开始（即ＤＡＴＡ语句的下一行），开始执行新的一遍数据步。
      ＤＥＬＥＴＥ语句与条件语句配合，可以实现用数据源的部分数据来建立数据集。
（7）循环语句
      ＳＡＳ的循环语句有步长型、离散型、当型和直到型四种形式。

　　此外还有其它的一些语句，将在以后的例题中逐一加以介绍。

SAS过程步

编号	过程名	功用	必要的语句
１	means	计算基本统计量	proc means; var x; run;
２	chart	制作次数分布表次数分布图	proc chart; hbar x; run;
３	univariate plot	正态分布检验	proc univariate plot; var x; run;
４	PRINT	数据输出	PROC PRINT ; RUN;
５	SORT	数据排序	PROC SORT; BY age; PROC PRINT; RUN;
６	tabulate	制作表格	PROC PRINT; Proc tabulate format=8.0; Class repname month; var unitsold; table month,repnameunitsoldsum; RUN;
７	anova;	单方面分类的方差分析	proc anova; classes a; model x = a;
８	anova	双方面分类的方差分析	proc anova; classes block a; model x =block a;
９	anova	三方面分类的方差分析	proc anova; classes A B T; model X1=A B T ;
１０	可选择: LSQ duncan duncan	多重比较可选择: LSQ测验邓肯Q测验图基Q测验	proc anova; classes block a; model x =block a; means block a /LSQ alpha=0.05; means block a /LSQ alpha=0.01;
１１	anova	2*2 复因子试验的统计分析方法	proc anova; classes block pinxi midu; model x=block pinxi midu pinxi*midu;
１２	anova;	222 复因子试验的统计分析方法	proc anova; classes block k p n x; model x=block k p n kp kn pn kp*n ;
１３	glm	协方差分析	proc glm; class t ; model y=t x;
１４	anova	多元方差分析	proc anova; class block tre ; model x1 x2 x3 =block tre; manova h=block tre /summary; run;
１５	anova	正交设计的分差分析	proc anova; classes block a b c d ; model x = block a b c d ; means block a b c d /lsd duncan tukey; run;
１６	nested	嵌套设计的方差分析	proc nested; classes plant leaf; var calcium; run;
１７	glm	带有交叉项的双向不均衡设计的方差分析	proc glm; class drug disease; model y=drug disease drug*disease /ss1 ss2 ss3 ss4; run;
１８	corr	简单相关系数	proc corr; var y;with x1; run;
１９	corr	一个变量与多个变量的简单相关系数	proc corr; var y;with a b c d e f ; run;
２０	corr	多个变量间的简单相关系数的计算	proc corr; run;
２１	plot	相关点式图的绘制	plot y*x='+'; rproc plot; un;
２２	corr,partial	一级净相关	proc corr; var y;with a; partial f; run;
２３	corr,partial	二级净相关	proc corr; var y;with f; partial a b ; run;
２４	corr,partial	三级净相关	proc corr; var y;with f; partial a b d ; run;
２５	cancorr	典型相关分析	proc cancorr; var y1 y2 y3 ;with x1 x2 x3 ; run;
２６	reg	直线回归	proc reg; model y=x1; run;
２７	reg	二元回归	proc reg; model y=x1 x2; run;
２８	reg 可选择: forward backward stepwise	多元回归可选择: 向前回归向后回归双重逐步回归	proc reg; model g=a b c d e f ／selection=forward; run;
２９	cluster 可选择: average wards density single twostage	聚类分析可选择: 类平均法重心法离差平均和法密度估计法最短距离法两阶段密度估计法	proc cluster method=average outtree=cate; var a b c d e f ; id bh; proc tree; run;
３０	fastclus	动态聚类分析	proc fastclus data=iris maxc=2 maxiter=10 out=clus; var sepallen sepalwid petallen petalwid; proc freq; tables cluster*species; run;
３１	standard	数据标准化	proc standard mean=0 std=1 out=new; run;
３２	princomp	主成分分析可选择: 由协差阵计算由相关矩阵计算	proc princomp cov; run; 或 proc princomp; run;
３３	factor 可选择:	因子分析可选择: 主分量分析主因子分析	proc factor data=socecon simple corr; run; 或 proc factor data=socecon priors=smc msa scree residual preplot rotate=promax reorder plot outstat=fact all; proc print; run;
３４	ttest	成组法 T 检验	proc ttest data=pinzhs; class pin; var yield; run;
３５	univariate	配对法 T 检验	proc univariate data=chromat; var methdiff; run;
３６	npar1way	秩和检验	proc npar1way data=gastric wilcoxon; class group; var lysolevl; run;
３７	univariate	符号秩检验	proc print data=chromat; proc univariate data=chromat; var methdiff; run;
３８	freq	卡平方测验可选择: 2×2 联列表式 2×j 联列表式 r×c联列表式	data; do a=1 to 2; do b=1 to 2; input x@@; output; end; end; cards; ...... ; proc freq; weight x; tables a*b / chisq ; run;
３９	reg	二次抛物线	proc reg data=uspop; var yearsq; model pop=year/r cli clm; plot r. p. ; add yearsq; print; plot; plot popyear='a' predicted.year='p' u95. year='u' l95. *year='l'/overlay; run;
４０	NLIN 可选择: dud MARQUARDT	负指数曲线可选择: 试位法麦夸特法	PROC NLIN BEST=10 METHOD=dud; PARMS B0=0 TO 2 BY .5 B1=.01 TO .09 BY .01; MODEL Y=B0(1-EXP(-B1X)); DER.B0=1-EXP(-B1X); DER.B1=B0XEXP(-B1X); OUTPUT OUT=B P=YHAT R=YRESID; PROC PLOT DATA=B; PLOT YX='A' YHATX='P'/OVERLAY VPOS=25; PLOT YRESID*X/VREF=0 VPOS=25; RUN;
４１	catmod	逻辑斯蒂回归（标准响应函数）	proc catmod; weight count; direct heat soak; model y=heat soak / freq ml nogls covb corrb; quit;
４２	sort RSREG	二次响应面分析	proc sort; by time temp; proc rsreg; model mbt=time temp; ridge max; run;
４３	lackfit	欠适测验	model mbt=time temp/lackfit; ridge max; run;
４４	score	得分分析	proc score data=fitness score=factout out=fscore; var age weight runtime runpulse rstpulse; run;
４５	stepdisc	逐步判别分析	proc stepdisc data=iris bsscp tsscp; class species ; var sepallen sepalwid petallen petalwid; run;
４６	candisc	典型判别分析	proc candisc data=iris out=outcan distance anova; class species ; var sepallen sepalwid petallen petalwid; run; proc plot; plot can2*can1=species; format species specchar.; title'Plot of Canonical Variables'; run;
４７	RSREG	岭嵴分析	PROC SORT; BY X1 X2 X3; PROC RSREG; MODEL Y=X1 X2 X3/LACKFIT; RUN; DATA B; -------GET THE ACTUAL VALUES--------; SET A END=EOF; OUTPUT; -------CREATE AN X1X2 GRID FOR PLOTTING--------; IF EOF THEN DO; Y=.; X3=1.77; DO X1=-1.5 TO 1.5 BY .1; DO X2=-2 TO 2 BY .1; OUTPUT; END; END; PROC RSREG DATA=B OUT=C NOPRINT; MODEL Y=X1-X3/PREDICT; DATA B; SET C; IF X3=1.77; PROC PLOT ; PLOT X1X2=Y/CONTOUR=6 HPOS=100 VPOS=36 HSPACE=10 HAXIS=-2 TO 2 BY .5 VAXIS=-1.5 TO 1.5 BY .5; RUN;

秒客网

SAS数据步与过程步，数据步语句

相关文章