【文件属性】:
文件名称:vae_class_imbalance:您可以在此处找到与此存储库相关的博客
文件大小:8KB
文件格式:ZIP
更新时间:2021-05-11 11:37:40
deep-learning tensorflow variational-autoencoder Python
目标
该存储库包含我使用变分自动编码器(VAE)解决类不平衡问题的工作。
问题
我们想要构建一个分类器,以区分数字0的图像和数字6的图像。我们有50000张0的图像和6张100的图像。
解决方案
在100张6幅图像上训练VAE,然后从该训练后的VAE生成6张图像。 使用这些额外的图像来训练分类器。
结果
与基于超采样的方法相比,基于VAE的数据增强方法可解决类别不平衡问题,准确性提高了50%。
原因
VAE能够生成更通用的图像,例如数字6的不同旋转以及不同的厚度。 因此,分类网络能够使用这些图像对测试数据集进行概括。
用
要生成其他图像6,请运行以下代码
cd vae
python main.py
这将生成一个名为vae_samples.npy的数据文件,其中包含数字6的其他图像。
要在没有基于VAE的数据扩充的情况下训练模型,请运行以下代码
python mnist_train.p
【文件预览】:
vae_class_imbalance-master
----mnist_train.py(5KB)
----README.md(1KB)
----vae()
--------ops.py(4KB)
--------utils.py(313B)
--------main.py(5KB)
----class-imbalance-experiments.ipynb(5KB)