WEKA 3.9.2中文手册 - 第2章 启动WEKA

时间:2024-03-31 10:52:08

    Weka GUI 选择器(weka.gui.GUIChooser 类)用于运行 Weka 的 GUI 主界面和相关工具。如果喜欢 MDI(多文档界面)风格的界面,可以运行Main启动器(weka.gui.Main 类)。

    GUI 选择器包含 5 个按钮,每个按钮代表一个主要的 Weka 应用程序;同时包含 4 个菜单项。

    WEKA 3.9.2中文手册 - 第2章 启动WEKA

    按钮分别用于启动以下应用程序:

    • Explorer 探索者界面,WEKA 中用于数据探索的软件环境(本文档将会详细介绍该软件的使用)。
    • Experimenter 实验者界面,针对不同的机器学习方法进行实验和统计测试。
    • KnowledgeFlow 知识流界面,功能和 Explorer 类似,但是使用拖拽的方式进行操作,同时它还支持增量学习。
    • Workbench 工作台界面,包含了其他界面的组合。
    • SimpleCLI 简单命令行界面,一个简易的命令行接口,可以在不支持命令行的操作系统中直接调用 Weka 命令。

    菜单包含以下 4 个部分:

    1.程序Program

    WEKA 3.9.2中文手册 - 第2章 启动WEKA

    • LogWindow 日志窗口,打开一个日志窗口,捕获所有的 stdout 或者 stderr 输出。对于某些环境非常方便,例如 MS Windows,因为 WEKA 通过不是通过终端命令行启动。
    • Memory usage 内存使用,显示 WEKA 内存使用情况,同时可以执行 JAVA 垃圾回收。
    • Settings 设置,可以设置图形界面的风格和网络超时时间。
    • Exit 退出,退出 GUI 选择器。

    2.可视化Visualization

    WEKA 3.9.2中文手册 - 第2章 启动WEKA

    • Plot 散点图,绘制数据集的 2D 散点图。
    • ROC 受试者工作特征曲线,显示预先保存的 ROC 曲线。
    • TreeVisualizer 树结构可视化,显示有向图,例如,决策树
    • GraphVisualizer 图结构可视化,显示 XML、BIF 或 DOT 格式的图,例如,贝叶斯网络。
    • BoundaryVisualizer 边界可视化,显示二维空间中分类器决策边界的可视化。

    3.工具Tools

    WEKA 3.9.2中文手册 - 第2章 启动WEKA

    • Package manager 包管理器,Weka 包管理系统的图形接口。
    • ArffViewer ARFF 文件查看器,以电子表格形式查看 ARFF 文件的 MDI 应用。
    • SqlViewer SQL 查看器,一个 SQL 工作表单,通过JDBC查询数据库。
    • Bayes net editor 贝叶斯网络编辑器,一个用于编辑、可视化和学习贝叶斯网络的应用。

    4.帮助Help

    WEKA 3.9.2中文手册 - 第2章 启动WEKA

    • Weka Homepage Weka 主页,在浏览器中打开 WEKA 主页。
    • HOWTOs, code snippets, etc. WekaWiki,其中包含许多关于 WEKA 开发和使用的示例和指南。
    • Weka on Sourceforge Sourceforge.net 上的 WEKA 项目。
    • SystemInfo 系统信息,显示关于 Java/WEKA 环境的内部信息,例如,CLASSPATH。

    为了方便用户通过扩展菜单添加新的功能,同时又不需要修改 WEKA 自身的代码,GUI 选择器提供了插件机制。基于内部的动态类发现机制,插件只需要实现 weka.gui.MainMenuExtension 接口,WEKA 就可以发现并且在“Extensions”菜单(发现插件后自动显示该菜单)下显示这些插件。更多信息可以查看 Wiki 中的文章“Extensions for Weka’s main GUI”。
    如果通过终端启动 WEKA,将会在终端显示一些信息。除非遇到错误,可以忽略这些信息。遇到错误时,这些信息可以用于查找原因(程序菜单下的日志窗口也可以显示该信息)。
    本手册关于探索者的部分不包含单独的 WEKA 数据预处理和学习算法介绍。更多关于 WEKA 中的各种过滤器和学习方法的信息,参考图书Witten, I.H. and Frank, E. (2016) Data Mining: Practical machine learning tools and techniques. Fourth Edition Morgan Kaufmann, San Francisco。