Fashion MNIST数据集介绍
一、总结
一句话总结:
甲)、Fashion-MNIST和mnist数据集非常相似,都是60000训练10000测试,图片也都是28*28
乙)、不过mnist是手写数字0-9分类,Fashion MNIST是服装的分类(T恤、衣服、裤子、鞋子等)
二、Fashion MNIST数据集介绍
转自或参考:【手记】MNIST终结者:Fashion-MNIST - 简书
https://www.jianshu.com/p/2ed1707c610d
Fashion-MNIST克隆了MNIST的所有外在特征:
- 60000张训练图像和对应Label;
- 10000张测试图像和对应Label;
- 10个类别;
- 每张图像28x28的分辨率;
- 4个GZ文件名称都一样;
对于已有的MNIST训练程序,只要修改下代码中的数据集读取路径,或者残暴的用Fashion-MNIST数据集文件将MNIST覆盖,替换就瞬间完成了。
不同的是,Fashion-MNIST不再是抽象符号,而是更加具象化的人类必需品——服装,共10大类:
Label | Description |
---|---|
0 | T恤(T-shirt/top) |
1 | 裤子(Trouser) |
2 | 套头衫(Pullover) |
3 | 连衣裙(Dress) |
4 | 外套(Coat) |
5 | 凉鞋(Sandal) |
6 | 衬衫(Shirt) |
7 | 运动鞋(Sneaker) |
8 | 包(Bag) |
9 | 靴子(Ankle boot) |
如果我们训练的模型能够识别出不同的服装类型,是不是觉得离“智能”更进一步了?没错。Fashion-MNIST要难得多。
我用一个3层全连接神经网络对它做了测试。对于MNIST可以达到95%识别率的训练代码,去训练Fashion-MNIST,最后模型识别率猛降了10个百分点。
对于一个人工智能算法,是否可用的一个根本性度量标准就是:不亚于人类。85%已然是不可用的状态。尽管如此,事情变的更有意思了,不是吗?
更多的算法Benchmark在这里(非深度学习),官方README中收集了未验证的深度学习算法的Benchmark。
本篇所用代码tf_fashion_mnist.py的测试结果: