1、如果想要利用代码(不论是python、c++、亦或是matlab)实现生成标签文件,首先,也是灰常重要的一件事就是你的图片集一定要是有规律的命名。数字字母顺序排开。这一点非常重要,相关重命名方法请自行百度或请教大牛。
2、如图为博主的图片集。(注意命名规律)
博主只分为猫和鸟两类。
3、看代码。
在caffe根目录下创建一个我们的工程目录my-caffe-project
创建并编辑create_db.py文件,使用如下指令:
1
|
vim create_db.py
|
然后,代码内容就是我们的重点了。注意相关变量和路径的修改。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
|
# -*- coding: utf-8 -*-
import os
import re
"""
函数说明:生成图片列表清单txt文件
parameters:
images_path - 图片存放目录
txt_save_path - 图片列表清单txt文件的保存目录
returns:
无
author:
jack cui
modify:
2017-03-29
"""
def createfilelist(images_path, txt_save_path):
#打开图片列表清单txt文件
fw = open (txt_save_path, "w" )
#查看图片目录下的文件,相当于shell指令ls
images_name = os.listdir(images_path)
#遍历所有文件名
for eachname in images_name:
#正则表达式这里可以根据情况进行更改,如果多类记得仿照下面定义相关变量
#正则表达式规则:找以cat开头,紧跟0到49个数字,并以jpg结尾的图片文件
pattern_cat = r '(^cat\d{0,49}.jpg$)'
#正则表达式规则:找以bird开头,紧跟0到49个数字,以jpg结尾的图片文件
pattern_bird = r '(^bird\d{0,49}.jpg$)' #更改变量名需要定义
#正则表达式匹配
cat_name = re.search(pattern_cat, eachname)
bird_name = re.search(pattern_bird, eachname)
#按照规则将内容写入txt文件中
if cat_name ! = none:
fw.write(cat_name.group( 0 ) + ' 1\n' )
if bird_name ! = none:
fw.write(bird_name.group( 0 ) + ' 2\n' ) #如果分为多类,多加几个if便是。当然相关变量也要记得定义。
#打印成功信息
print "生成txt文件成功"
#关闭fw
fw.close()
#下面是相关变量定义的路径
if __name__ = = '__main__' :
#caffe_root目录
caffe_root = '/home/xn/caffe/'
#my-caffe-project目录
my_caffe_project = caffe_root + 'my-caffe-project/'
#图片存放目录
images_path = caffe_root + 'data/mydata/myimagenet/train/'
#生成的图片列表清单txt文件名
txt_name = 'train.txt'
#生成的图片列表清单txt文件的保存目录
txt_save_path = my_caffe_project + txt_name
#生成txt文件
createfilelist(images_path, txt_save_path)
|
完成。如果想要生成测试标签文件类似。
以上这篇python方法生成txt标签文件的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/xunan003/article/details/73741797