文件名称:SDMetrics:评估合成数据集质量和功效的指标
文件大小:348KB
文件格式:ZIP
更新时间:2024-04-18 23:37:44
quality metrics synthetic-data Python
一个从开源项目 综合数据生成项目的指标 网址: : 文档: : 仓库: : 执照: 发展状况: 概述 SDMetrics库提供了一组与数据集无关的工具,用于通过将综合数据库与建模后的真实数据库进行比较来评估综合数据库的质量。 它支持多种数据模式: 单列:比较代表各个列的一维numpy数组。 列对:比较pandas.DataFrame列如何pandas.DataFrame关联(以2组为一组)。 单个表:比较整个表,以pandas.DataFrame表示。 多表:将以python dict表示的多表和关系数据集与以pandas.DataFrame传递的多个表进行pandas.DataFrame 。 时间序列:比较代表事件顺序的表格。 它包括各种指标,例如: 使用统计检验比较实际和合成分布的统计量度。 使用机器学习来尝试区分真实数据和合成数据的检测指标。 效能