Fashion MNIST数据集介绍

时间:2024-03-11 15:34:04

Fashion MNIST数据集介绍

一、总结

一句话总结:

甲)、Fashion-MNIST和mnist数据集非常相似,都是60000训练10000测试,图片也都是28*28
乙)、不过mnist是手写数字0-9分类,Fashion MNIST是服装的分类(T恤、衣服、裤子、鞋子等)

 

 

二、Fashion MNIST数据集介绍

转自或参考:【手记】MNIST终结者:Fashion-MNIST - 简书
https://www.jianshu.com/p/2ed1707c610d

 

Fashion-MNIST克隆了MNIST的所有外在特征:

  • 60000张训练图像和对应Label;
  • 10000张测试图像和对应Label;
  • 10个类别;
  • 每张图像28x28的分辨率;
  • 4个GZ文件名称都一样;

对于已有的MNIST训练程序,只要修改下代码中的数据集读取路径,或者残暴的用Fashion-MNIST数据集文件将MNIST覆盖,替换就瞬间完成了。

不同的是,Fashion-MNIST不再是抽象符号,而是更加具象化的人类必需品——服装,共10大类:

LabelDescription
0 T恤(T-shirt/top)
1 裤子(Trouser)
2 套头衫(Pullover)
3 连衣裙(Dress)
4 外套(Coat)
5 凉鞋(Sandal)
6 衬衫(Shirt)
7 运动鞋(Sneaker)
8 包(Bag)
9 靴子(Ankle boot)
 
 

 

 

Fashion Mnist

如果我们训练的模型能够识别出不同的服装类型,是不是觉得离“智能”更进一步了?没错。Fashion-MNIST要难得多。

我用一个3层全连接神经网络对它做了测试。对于MNIST可以达到95%识别率的训练代码,去训练Fashion-MNIST,最后模型识别率猛降了10个百分点。

对于一个人工智能算法,是否可用的一个根本性度量标准就是:不亚于人类。85%已然是不可用的状态。尽管如此,事情变的更有意思了,不是吗?

更多的算法Benchmark在这里(非深度学习),官方README中收集了未验证的深度学习算法的Benchmark。

 

本篇所用代码tf_fashion_mnist.py的测试结果:

 

 

识别Fashion-MNIST