前言
当我们开始学习编程的时候,第一件事往往是学习打印“HelloWorld”。就好比编 程入门有 HelloWorld,机器学习入门有 MNIST。
MNIST 是一个入门级的计算机视觉数据集,它包含各种手写数字图片,以及每一张图片对应的标签(标签用于告诉我们这个是数字几)。MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字,其中数字的范围从0到9。
在此教程中,我们通过将训练一个机器学习模型用于预测图片里面的数字,介绍下如何使用TensorFlow。所以,我们这里会从一个很简单的数学模型开始,它叫做 SoftmaxRegression。
对应这个教程的实现代码很短,而且真正有意思的内容只包含在三行代码里面。但是,去理解包含在这些代码里面的设计思想是非常重的:TensorFlow 工作流程和机器学习的基本概念。因此,这个教程会很详细地介绍这些代码的实现原理。
准备数据
官方的下载方式:下载并执行input_data.py
在 input_data.py
文件中, maybe_download()
函数可以确保这些训练数据下载到本地文件夹中。
由于下载不方便,这篇文章的例程片段可以在-这里-下载。下载后运行里面的py即可完成数据的下载,其他部分仍需要读者自行完成。
为了独立学习的必要,本人独立提供一份input_data.py,供读者自行使用: