工具:
SPSS Modeler 14.1
MySQL
《SPSS数据分析与挖掘实战案例精粹》书籍及数据包(以上工具的下载链接见文末)
《SPSS数据分析与挖掘实战案例精粹》第五章
我是跟着这本书学习SPSS Modeler软件以及数据挖掘的,案例很丰富并且有配套的数据文件以及例程,书也讲解地清晰易懂,可谓是入门选手的不二之选。在这里插播一句,如果是有大作业或者是新软件需要学习,最好还是能选取本领域较为经典易懂的书籍来进行学习,而不是通过网络。一是网络上的例子太多且繁,对于新手而言很容易迷失,不能高效快速地找到需要的内容;二是网络上很多例程并不全,国外网站会相对来说好一些,不过对于入门级选手而言,一开始上手外文资料并不是最好的选择。书籍内容详细,且配套例程全面,遇到不懂的问题再求助于网络,这是我认为的最高效快捷的方法。
我也是在学习中走了弯路才明白这个道理,也许不适合所有人,如果有不同的见解也欢迎交流。
其实软件并不难,我认为比较难的是环境配置,这块占用了我很多时间,大功告成之后就想记录下来,希望能够帮助到其他人。
关于环境配置,先来看两张图。图一和图二分别是《SPSS数据分析与挖掘实战案例精粹》第五章5.3.1和5.4中的截图。大体内容相同,我们选择图二来进行讲解和说明。
图一 5.3.1数据整理案例
图二 5.4案例分析:药物选择决策支持
第一步:打开SPSS Modeler
以5.4.4数据理解为例,打开“SPSS案例数据-Chapter5-stream-5.药物选择决策支持_数据理解.str”,分析模型如下:
双击SQL,如图所示:
其中,“数据源”表示要连接的数据库。可以看出Drug是标红的,因为此时数据源并没有和数据库链接。
第二步:下载并安装SQL
因为数据流是从Access中读取,因此需要先进行数据库配置用户DSN。之前系统没有装SQL,因此在连接Access的时候会报错,所以要先下载安装SQL。下载和安装教程可以参考以下链接:https://jingyan.baidu.com/article/f79b7cb3a25e759144023ee7.html
第三步:MySQL配置ODBC数据源
MySQL下载好之后需要进行配置的,这一步花了我好长时间,好气喔!关于配置过程,可以参考链接:https://jingyan.baidu.com/article/8065f87f38b31423312498e4.html
因为我们已经下载了MySQL,所以不需要再从网上下载驱动程序,可以从链接网址的第三部开始做。
第四步:配置MS Access Database
添加了MySQL后用户的DSN如下所示,但是MS Access需要进行配置。过程如图所示。
点击“配置”。
点击“选择”,在路径中找到数据库名,确定。
(注:不同的工程可能需要不同的数据库,因此在变更功能的时候或许需要更改链接的数据库,过程方法与此相同。)
选择数据库名称,点击确定。
第五步:回到Modeler界面,点击下拉菜单。
为了方便新手理解,我们采用“添加新数据库连接”。
选择数据源,并且键入用户名和密码。(用户名和密码是在配置MySQL时设置的)
点击确定即可。
此时就可以正常运行了。注意一个模型中若出现多个与SQL的数据库链接,每个都需要类似配置(但是不需要再次键入用户名与密码)。
大家也可以参考一下这篇文章,是讲解的较清楚明白的了,我在配置环境时候的重要参考:https://www.ibm.com/developerworks/cn/data/library/ba/ba-1403spssintegrate/
下载链接:
书籍pdf(去网上找一下咯~)