CLH blog AI CV Algorithm

Convolution Neural Network

2017-08-14

CLH

Computer_Vision

Machine_Learning

Convolution Neural Network#
- 卷积层
池化/采样层
- 经典的CNN模型：LeNet-5

Convolution Neural Network#

Convolution Neural Network(CNN,卷积神经网络）广泛应用于计算机视觉领域，如图像分类、人脸识别等；CNN是一种前馈神经网络，是深度学习中极具代表的网络结构之一，ImageNet数据集上许多成功的模型都是基于CNN的；与传统的图像处理算法相比，CNN的优点是避免了对图像复杂的前期预处理过程（提取人工特征等），它可以直接输入原始图像。CNN采用局部连接、权值共享等方法减少训练参数和训练时间。
经典的CNN结构为LeNet-5网络，结构如下：

CNN主要有两种类型的网络层，即卷积层和池化/采样层（Pooling），卷积层的作用是提取图像的各种特征；池化层的作用是对原始特征信号进行抽象，大幅度减少训练参数，减轻模型过拟合的程度。

卷积层

卷积过程如下：

池化/采样层

卷积层获取图像特征后，理论上可以用这些特征训练分类器，但计算量比较大，容易产生过拟合现象；为了降低网络训练参数及模型的过拟合程度，对卷积层进行池化/采样（Pooling）处理，有两种方式：

Max-Pooling:选择Pooling窗口中的最大值作为采样值；
Mean-Pooling:选择Pooling窗口中的平均值作为采样值。

如下图所示：

经典的CNN模型：LeNet-5

LeNet-5在MNIST数据集上的结果：

【Ref】:
[1] Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks.
[2] 卷积神经网络(CNN)学习笔记1：基础入门

上一篇 Face Detection and Face Recognition

下一篇 Kernelized Correlation Filters

Comments

Content

Comments