caffe实际运行中遇到的问题

https://blog.csdn.net/u010417185/article/details/52649178

1、均值计算是否需要统一图像的尺寸？

在图像计算均值时，应该先统一图像的尺寸，否则会报出错误的。

粘贴一部分官方语言：

均值削减是数据预处理中常见的处理方式，按照之前在学习ufldl教程PCA的一章时，对于图像介绍了两种：第一种常用的方式叫做dimension_mean（个人命名），是依据输入数据的维度，每个维度内进行削减，这个也是常见的做法；第二种叫做per_image_mean，ufldl教程上说，在natural images上训练网络时；给每个像素（这里只每个dimension）计算一个独立的均值和方差是make little sense的；这是因为图像本身具有统计不变性，即在图像的一部分的统计特性和另一部分相同。作者最后建议，如果你训练你的算法在非natural images（如mnist，或者在白背景存在单个独立的物体），其他类型的规则化是值得考虑的。但是当在natural images上训练时，per_image_mean是一个合理的默认选择。

这段话意在告诉我们在训练的图像不同，我们均值采用的方法亦可发生变化。

了解完后我们来看一下如果图像尺寸不统一会报出什么样子的错误：

上图中很明显爆出了“size_in_datum == data_size ” 的错误。

下面是小编找到的问题原因：

在把图片转化到levelDB中遇到了Check failed: data.size() == data_size，归根究底还是源码没细看，找到出错的行在F0714 20:31:14.899121 26565 convert_imageset.cpp:84] convert_imageset.cpp中的第84行， CHECK_EQ(data.size(), data_size) << "Incorrect data field size " << data.size();就是说两个大小不一致，再看代码

int data_size;
bool data_size_initialized = false;
for (int line_id = 0; line_id < lines.size(); ++line_id) {
if (!ReadImageToDatum(root_folder + lines[line_id].first,lines[line_id].second, datum)) {
continue;
}
if (!data_size_initialized) {
data_size = datum.channels() * datum.height() * datum.width();
data_size_initialized = true;
} else {
const string& data = datum.data();
CHECK_EQ(data.size(), data_size) << "Incorrect data field size "
<< data.size();
}

从上面的代码可知，第一次循环中，data_size_initialized=false，然后进入到if (!data_size_initialized) 中，把data_size设为了datum.channels() * datum.height() * datum.width()，同时把data_size_initialized=true，在以后的迭代中，都是执行else语句，从而加入图片大小不一致会报错，处理的办法可选的是，在转换到数据库levelDB前，让图片resize到一样的大小，或者把ReadImageToDatum改成ReadImageToDatum(root_folder + lines[line_id].first,lines[line_id].second,width,height ,datum)。

参考博文地址：http://blog.csdn.net/alan317/article/details/37772457

2、caffe实际运行中图像大小不一，放大缩小时都有可能失真，此时该如何处理数据？

如果处理的图像大小不一且过度放大或者过度缩小会造成图像严重失真且丢失信息，则不能直接对图像尺寸进行归一化。

措施：

可以采用一个居中的尺寸，例如统一图像的宽度为600，而高度根据宽度的大小按照比例进行缩放。处理完之后可以对图像进行切片处理，进而将图像尺寸进行归一化。

3、Crop_size的作用？

对图像进行裁剪，如果原图为800*800，而我们只需进行600*600图像检测时，我们可以使用crop_size进行图像截取。当截取的模式为TRAIN时，截取方式为随机截取。其他的模式则只截取图像的中间区域。

具体可查看http://blog.csdn.net/u010417185/article/details/52651761

4、在网络配置文件中的 test_iter 值得确定

# reduce the learning rate after 8 epochs (4000 iters) by a factor of 10
# The train/test net protocol buffer definition
net: "examples/cifar10/cifar10_quick_train_test.prototxt"
# test_iter specifies how many forward passes the test should carry out.
# In the case of MNIST, we have test batch size 100 and 100 test iterations,
# covering the full 10,000 testing images.
test_iter: 100
# Carry out testing every 500 training iterations.
test_interval: 100
# The base learning rate, momentum and the weight decay of the network.
base_lr: 0.001
momentum: 0.9
weight_decay: 0.004
# The learning rate policy
lr_policy: "fixed"
# Display every 100 iterations
display: 100
# The maximum number of iterations
max_iter: 4000
# snapshot intermediate results
snapshot: 4000
snapshot_format: HDF5
snapshot_prefix: "examples/cifar10/cifar10_quick"
# solver mode: CPU or GPU
solver_mode: CPU

在设置配置时，对于test_iter值的计算有一点模糊，不知是根据batch size 值与整体图像库（测试集合与训练集合）还是单独的某个图像集合数据计算获得。后来通过认真读给出的解释与实例，最终确定该值是batch size 值与测试图像集合计算获得的。若batch size 值为100，而训练集合含有6000幅图片，测试集含有1000幅图片，则test_iter值为1000/10，与训练集的图片量无关。

5、如何判断一个模型已经训练好，可以正常使用？

6、能否将caffe从Linux下导出，形成一个独立包？

7、Cannot copy param 0 weights from layer 'conv1'; shape mismatch.

caffe实际运行中遇到的问题

相关网页：http://*.com/questions/37300317/caffe-error-cannot-copy-param-0-weights-from-layer-shape-mismatch

http://blog.csdn.net/ddqqfree123/article/details/52389337

http://blog.csdn.net/preston2006/article/details/53421889

网络上给出的解决方法：

Share the prototxt file that you used to train and test to pinpoint the issue. It should be mainly because the dimensions of the input image is not the same in both the test prototxt and train prototxt. Check the height, width and channel count of both the test and train prototxt

实际解决方法与解析：

“conv1” ; shape mismatch 已经很明确的给出了错误的原因，原始shape不一致，同时又很明确的指出了是cov1层出现的错误。所以直接找shape\cpnv1，之后才发现是训练模型文件与模型定义文件中的shape不相符，我训练时图像库中有的图像是一个通道，有的是使用的3个通道，所以默认使用三个通道，而我的模型定义文件中的shape,其通道数写的是1个通道，故出现错误。

8、ValueError: could not broadcast input array from shape (1,40,40) into shape (1,6,6)

这是分类时候出现的问题，从给出的信息可以看出模型部分已经完全跑通，但是在输入图片进行分析的时候却出现了问题。由给出的日志信息可以看出程序是在classify.py中出现的问题，那就从Classify.py开始找，错误提示了图像的大小不对，所以找程序中图像大小设置的地方。

我的这个地方原来没有进行修改，所以出现了上述错误。

9、caffe 提示 build/examples/mnist/convert_mnist_data.bin: error while loading shared libraries: libprotobuf.so.8: cannot open shared object file: No such file or directory

caffe实际运行中遇到的问题

解决方法：

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/dell/local_install/lib

如图所示：

caffe实际运行中遇到的问题

10、在生成lmdb过程中提示：Check failed:mkdir( source.c_str() , 0744 ) == 0 ( -1 vs. 0 ) mkdir /home/dell/multiple_caffe/sgg_projects/codes/train_label_lmdb failed

caffe实际运行中遇到的问题

从上述提示错误中很明显是 train_label_lmdb 出现错误。所以从这点开始寻找突破点。最终找到的问题所在：在生成 lmdb 过程中，需要先删除原有的lmdb 文件，否则就会出现这种错误。在生成之前添加：

rm -rf $EXAMPLE/train_label_lmdb

caffe实际运行中遇到的问题

11、生成均值文件时提示错误： Check failed: mdb_status == 0 (2 vs. 0) No such file or directory

caffe实际运行中遇到的问题

小编出现这个错误是由于生成均值的文件中变量没有赋值正确，所以如果出现这个问题，现确定你的生成均值文件中的变量值都是正确的。

12、小编近期在使用caffe进行训练时，常出现 Check failed: error == cudaSuccess (2 vs. 0) out of memory 错误。

从错误提示可以看出是内存不够了。所以小编就加了一个8G 内存条（刚好手边有），可是加上了并没有多大的作用啊，还是照样报错。后来才找到解决方法。

解决方法：

batch_size太大了，一次性读入的图片太多了，所以就超出了显存。因此需要将train.prototxt中的文件train和test的batch_size调小一点。

参考博文：http://blog.csdn.net/qq_29596177/article/details/56692295

caffe实际运行中遇到的问题的更多相关文章

Ubuntu16&period;04 faster-rcnn+caffe+gpu运行环境配置以及解决各种bug
https://blog.csdn.net/flygeda/article/details/78638824 本文主要是对近期参考的网上各位大神的博客的总结,其中,从安装系统到跑通程序过程中遇到的各种 ...
android大项目运行中出现问题汇总
Android 项目中,特别是当项目文件和规模达到一定的程度后,会引发一些平常不常见的问题. 下面对遇到的一些问题做一个汇总和总结. scenario 1: 在项目中,我们采用了chromimum内核 ...
在linux下，查看一个运行中的程序，占用了多少内存
1. 在linux下,查看一个运行中的程序, 占用了多少内存, 一般的命令有 (1). ps aux: 其中 VSZ(或VSS)列表示,程序占用了多少虚拟内存. RSS列表示, 程序占用了多少物 ...
java中如何使正在运行中的线程退出
终止线程的三种方法有三种方法可以使终止线程. 1. 使用退出标志,使线程正常退出,也就是当run方法完成后线程终止. 2. 使用stop方法强行终止线程(这个方法不 ...
Linux显示所有运行中的进程
Linux显示所有运行中的进程 youhaidong@youhaidong-ThinkPad-Edge-E545:~$ ps aux | less USER PID %CPU %MEM VSZ RSS ...
在linux下，怎么去查看一个运行中的程序，到底是占用了多少内存
1. 在linux下,查看一个运行中的程序, 占用了多少内存, 一般的命令有 (1). ps aux: 其中 VSZ(或VSS)列表示,程序占用了多少虚拟内存. RSS列表示, 程序占用了多少物 ...
Docker学习笔记 - 在运行中的容器内启动新进程
docker psdoker top dc1 # 容器情况# 在运行中的容器内启动新进程docker exec [-d] [-i] [-t] 容器名 [command] [args]docker ex ...
如何修改运行中的docker容器的端口映射和挂载目录
在docker run创建并运行容器的时候,可以通过-p指定端口映射规则.但是,我们经常会遇到刚开始忘记设置端口映射或者设置错了需要修改.当docker start运行容器后并没有提供一个-p选项或设 ...
教你如何修改运行中的docker容器的端口映射
在docker run创建并运行容器的时候,可以通过-p指定端口映射规则.但是,我们经常会遇到刚开始忘记设置端口映射或者设置错了需要修改.当docker start运行容器后并没有提供一个-p选项或设 ...

随机推荐

从LIS问题浅谈动态规划
今天以LIS问题切入动态规划,现在做一些简单的总结. LIS问题: http://www.cnblogs.com/Booble/archive/2010/11/27/1889482.html
通过js判断访客显示器屏幕分辨率并给出提示
<script> <!-- fw="1920";fh="1200"; var uw=window.screen.width; var uh=w ...
【Hadoop学习】Apache HBase项目简介
正在撰写,稍后来访……
Android模拟器常用命令收录
一.Linux命令 1.挂载/systme分区为读写状态 mount -o remount,rw -t yaffs2 /dev/block/mtdblock3 /system 2.切换为Root用户 ...
Spring&lowbar;Spring与AOP
一.传统编程使用代理解决目标类增强问题 //主业务接口 public interface ISomeService { // 目标方法 void doFirst(); // 目标方法 void doS ...
Git版本控制 — 日常使用(二)
本地使用以下是我的一些日常操作. (1) 创建版本库 # cd /proj # git init Initialized empty Git repository in /proj/.git/ (2 ...
第1章 Linux内核简介
1.1 Unix的历史 unix的优点简介,没有繁冗的系统调用所有东西都被当成了文件对待,对文件和对设备的操作是通过同样的系统调用的接口实现的内核和相关工具使用C编写,具有很高的可移至性创建新 ...
CC攻击介绍及如何防御
CC攻击介绍 CC攻击(Challenge Collapsar)是DDOS(分布式拒绝服务)的一种,前身名为Fatboy攻击,也是一种常见的网站攻击方法.攻击者借助代理服务器生成指向受害主机的合 ...
材料订单不在IN&lowbar;MO或者IN&lowbar;SCFHEADER中
select * from in_sfcheader where MO_ID IN('001600044481'); SELECT * FROM in_sfcheader_temp where MO_ ...
ArcGIS pro2&period;3中添加天地图底图
应用背景: 很多时候,我们需要使用网络上的遥感影像或者百度地图.天地图等在线地图做一些矢量化工作或者其他. 笔者见过很多人都是把百度地图截图,然后把图片导如Arcmap或者Arcgis pro中,然后 ...