文件名称:elki:ELKI数据挖掘工具包
文件大小:8.63MB
文件格式:ZIP
更新时间:2024-02-23 21:46:35
visualization java data-science machine-learning data-mining
艾尔基 索引结构支持的KDD应用程序开发环境 快速总结 ELKI是用Java编写的开源(AGPLv3)数据挖掘软件。 ELKI的重点是算法研究,重点是聚类分析和离群值检测中的无监督方法。 为了获得高性能和可伸缩性,ELKI提供了许多数据索引结构,例如R * -tree,它们可以带来很大的性能提升。 ELKI的设计易于扩展到该领域的研究人员和学生,并欢迎特别是新方法的贡献。 ELKI的目的是提供大量高度可参数化的算法,以允许轻松,公平地评估和基准化算法。 背景 数据挖掘研究产生了许多用于类似任务的算法。 由于以下几个原因,很难对这些算法进行公平,有用的比较: 比较伙伴的实现尚未实现。 如果提供了不同作者的实现,则在效率方面的评估会偏向于评估不同作者在有效编程中的努力,而不是评估算法的优缺点。 另一方面,高效的数据管理工具(如索引结构)可能对数据挖掘任务产生巨大影响,因此可用于多种算法。 在ELKI中,数据挖掘算法和数据管理任务是分开的,并允许进行独立评估。 这种分离使ELKI在数据挖掘框架(例如Weka或Rapidminer)和索引结构框架(例如GiST)之间是独一无二的。 同时