Caffe(Convolutional Architecture for Fast Feature Embedding,快速特征嵌入的卷积体系结构),是一个高效的深度学习框架,底层核心语言是C++,它支持命令行、Python和Matlab接口,它既可以在CPU上运行也可以在GPU上运行,据文献显示目前部分科技公司在尝试将Caffe模型在NPU上运行,以提高系统处理效率。
Caffe的所有计算都由layer的形式表示,即接受数据,输出计算结果等。
1 Caffe框架
Caffe把网络中的数据抽象为Blob,各层网络抽象成Layer,整个网络抽象成Net,网络求解方法抽象为Solver。
(1) Model
models以Google Protocol Buffers的方式存储在磁盘上。
(2) Blobs
描述了layer与layer、layer与net之间的数据存储和通信等。通常Blob以4维数据矩阵(batch, channel, height, weight)的方式存储数据、参数以及loss。
Blob存储4维数据时:
- Data blob: batch * channel * height * weight
- Kernel blob <卷积权重>: output * intput * height * weight
- Bias blob <卷积偏置>: output * 1 * 1 * 1
(3) Layers
是model计算的基础,是网络的基本单元。神经网络的一层对应一个layer,可以用一个或多个的blob作为输入(input blob)或输出(output blob)。layer的职责为前向传播和反向传播。
(4) Net
是layers组成的有向无环图。
(5) Solver
是Net的求解。
(6) Caffe
定义layer-by-layer网络。会保留完整的有向无环图保证前向和反向传播。
- Caffe是端到端的ML系统,典型网络从data(数据)层开始到loss层结束。
特点
- 模块化:允许对新数据格式、网络层和损失函数进行扩展。
- 表示和实现分离:模型定义用Protocol Buffer语言写进配置文件,即通过文本构建模型和优化策略,而不是代码。