spss C# 二次开发 学习笔记(二)——Spss以及统计术语解释(IT人眼中的统计术语)

时间:2023-02-09 14:45:25

针对客户需求,需要对一些数据做统计分析。统计分析的第一步,即为数据查询,查找出要统计分析的数据。

查询得出的是一个行列表格的结果集,行、列、表格等这些IT的数据库概念和Spss以及统计中的术语是如何对应的,这点是刚接触统计这方面的我首先要理清楚的。

变量(Variable)——结果集中的列。可以为数据库表字段,当然也可以使使用函数处理后的,即为表达式。

变量的类型分为字符型和数值型,有长度设置,对于数值有精度设置。

数值型,有数值和数值标签一说,例如性别,如果为字符型,则值为男或者女,如果为数值型,则值为1或者2,然后1、2为数值,对应的有男、女为数值标签。

案例(Case)——结果集中的行。一行记录为一个案例。

数据(Data)——结果集。

值(Value)——结果集中单元格的值,常量数据。

Spss作为一个统计分析工具,在IT人的眼中,关注的可能不是它能实现什么功能,而是它的输入和输出是什么。

Spss的输入,可以是它自定义的标准数据文件sav,也可以是数据库、Excel以及文本文件等,当然sav文件可以来自于Excel等。

而Spss的输出,包括统计分析的结果,例如图、表等,也包括命令日志、警告信息等。