caltech101(101类图像数据库)数据集
数据集地址: http://www.vision.caltech.edu/Image_Datasets/Caltech101/Caltech101.html
然后点击Download 点击下载: 101_ObjectCategories.tar.gz (131Mbytes)如下图1、图2所示
图1
图2
2.将下载的tar.gz文件上传到 caffe/data目录下执行命令:tar -xzvf file.tar.gz 解压缩
caffe数据集的创建需要两个文件: train.txt 和 val.txt, 格式为 图片路径+类别编号
这里用用运行gettxt.py自动生成train.txt和val.txt,gettxt.py的代码如下:
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import os
root = os.getcwd() #获取当前路径
data = '101_ObjectCategories' #101数据集的文件夹名称
path = os.listdir(root+'/'+ data) #显示该路径下所有文件
path.sort()
vp = 0.1 #测试集合取总数据前10%
ftr = open('train.txt','w')
fva = open('val.txt','w')
i = 0
for line in path:
subdir = root+'/'+ data +'/'+line
childpath = os.listdir(subdir)
mid = int(vp*len(childpath))
for child in childpath[:mid]:
subpath = data+'/'+line+'/'+child;
d = ' %s' %(i)
t = subpath + d
fva.write(t +'\n')
for child in childpath[mid:]:
subpath = data+'/'+line+'/'+child;
d = ' %s' %(i)
t = subpath + d
ftr.write(t +'\n')
i=i+1
ftr.close() #关闭文件流
fva.close()
3.运行gettxt.py结果如下图3
图3
4.转换成lmdb格式
mkdir calt101net # 在caffe/examples下建立一个新文件夹
将caffe/examples/imagenet下的create_imagenet.sh 复制到calt101net中
vim修改caffe/examples/calt101net下的create_imagenet.sh ,原先里面内容如图4所示,修改完成后如图5所示
图4
图5
运行 ./examples/calt101net/create_imagenet.sh 生成lmdb文件,运行结果如下图6所示
图6
修改calt101net下的make_imagenet_mean.sh 并运行会根据lmdb文件生成一个均值文件
5.把caffe/models/bvlc_reference_caffenet/下的两个文件: solver.protoxt 和 train_val.protoxt[DAG网络]复制到calt101net中进行修改,首先修改examples/MyNet/train_caffenet.sh
然后修改solver.protoxt文件内容
修改train_val.prototxt文件内容,四项内容如下
从0开始训练和微调
./examples/MyNet/train_caffenet.sh