Caffe模型详细介绍

Caffe（Convolutional Architecture for Fast Feature Embedding，快速特征嵌入的卷积体系结构），是一个高效的深度学习框架，底层核心语言是C++，它支持命令行、Python和Matlab接口，它既可以在CPU上运行也可以在GPU上运行，据文献显示目前部分科技公司在尝试将Caffe模型在NPU上运行，以提高系统处理效率。

Caffe的所有计算都由layer的形式表示，即接受数据，输出计算结果等。

1 Caffe框架

Caffe把网络中的数据抽象为Blob，各层网络抽象成Layer，整个网络抽象成Net，网络求解方法抽象为Solver。

(1) Model

models以Google Protocol Buffers的方式存储在磁盘上。

(2) Blobs

描述了layer与layer、layer与net之间的数据存储和通信等。通常Blob以4维数据矩阵（batch, channel, height, weight）的方式存储数据、参数以及loss。

Blob存储4维数据时：

Data blob: batch * channel * height * weight
Kernel blob <卷积权重>: output * intput * height * weight
Bias blob <卷积偏置>: output * 1 * 1 * 1

(3) Layers

是model计算的基础，是网络的基本单元。神经网络的一层对应一个layer，可以用一个或多个的blob作为输入（input blob）或输出（output blob）。layer的职责为前向传播和反向传播。

(4) Net

是layers组成的有向无环图。

(5) Solver

是Net的求解。

(6) Caffe

定义layer-by-layer网络。会保留完整的有向无环图保证前向和反向传播。

Caffe是端到端的ML系统，典型网络从data(数据)层开始到loss层结束。

特点

模块化：允许对新数据格式、网络层和损失函数进行扩展。
表示和实现分离：模型定义用Protocol Buffer语言写进配置文件，即通过文本构建模型和优化策略，而不是代码。

秒客网

Caffe模型详细介绍

1 Caffe框架

特点

相关文章