文件名称:ai-lab-daco:用于对两个数据集进行统计比较的软件包
文件大小:26.37MB
文件格式:ZIP
更新时间:2024-04-16 22:22:55
comparing-datasets Python
DACO-数据框比较工具 现在,您被困在包含用于比较Python中两个Pandas数据帧的包/类开头的存储库中。 目的是能够在多个上下文中比较数据框,例如,检查合成数据集是否足以满足您的目的。 完整文档可在找到。 安装 克隆此仓库 cd进入这个仓库 运行pip install . 哎呀! 简短的操作方法 想法是像这样使用它: import daco # load your data frames df1 = ... df2 = ... # create the daco-object daco_obj = daco . daco ( df1 , df2 , name1 = 'real_df' , name2 = 'fake_df' ) # calculate distributions for all variables/columns in the dataframes dist