深度卷积网络

作者: 此间不留白 | 来源:发表于2019-11-22 21:02 被阅读0次

CNN学习笔记
AI数学基础33-深度卷积网络在学什么？
一文带你认识深度学习中不同类型的卷积
Convolution Network and Applicat
无知的一些入门的东西
各种卷积网络（转）
《解析卷积神经网络—深度学习实践手册.pdf》PDF高清完整版-
深度卷积网络
深度学习中的各种卷积操作
Keras深度学习实践3—计算机视觉问题：猫vs狗

经典网络

LeNet网络

LeNet网络的结构如下图所示，可以看出，LeNet网络并没有使用padding，每进行一次卷积，图像的高度和宽度都会缩小，而通道数会一直增加。在全连接层中有400个节点，每个极点都有120个神经元，有时还会从这400个节点抽取一部分节点构建一个全连接层，即有两个全连接层。在该网络中，最后一步就是利用84个特征得到最后的输出，该网络刚开始使用的是sigmoid函数tanh函数，而现在常常倾向于使用softmax函数。需要注意的是，LeNet-5网络进行图像分类时，输入的图像是单通道的灰度图像。

AlexNet

AlexNet是以论文第一作者的名字命名的，该网络的结构，如下图所示，该网络的输出层使用了softmax函数。AlexNet网络比LeNet网络规模更大，大约有6000万个参数，用于训练图像和数据集时，能够处理非常相似的基本构造模块，这些模块中包含着大量的隐藏单元，并且与LeNet网络不同的是，该网络使用了ReLu的激活函数。

VGG-16

VGG-16网络没有太多的超参数，这是一种专注于构建卷积层的简单网络。如下图所示，该网络首先利用64个过滤器进行了两次卷积，接着在池化层将输入图像压缩，接着又是128个过滤器进行两次卷积，接着载池化。继续用256个过滤器进行3次卷积，再池化，接着再利用512个过滤器卷积3次，再池化，将稍后得到的特征图进行全连接操作，再进softmax激活。

残差网络（ResNets：Residual　Networks）

由于存在梯度消失和梯度爆炸的原因，深层次的神经网络是很难训练的，如果采用一种跳跃连接的方式，即从某一层网络层获取激活，然后迅速反馈给另外一层，甚至是神经网络的更深层。这种利用跳跃连接构建的深度神经网络ResNets，深度能够超过100层

一个简单的两层神经网络示例，如下图所示：

常规的输出和输出之间的关系可以用如下的公式表示：
$z^{[l+1]} = W^{[l+1]}a^{[l]}+b^{[l+1]} \tag{1}$
$a^{[l+1]} = g(z^{[l+1]}) \tag{2}$
$z^{[l+2]} = W^{[l+2]}a^{[l+1]}+b^{[l+2]} \tag{3}$
$a^{[l+2]} = g(z^{[l+2]}) \tag{4}$
$a^{[l+2]} = g(z^{[l+2]}) \tag{5}$

如上公式所述，这是一条神经网络的主路径。如果将 $a^{[l]}$ 的输入直接到深层的激活函数之前，此时，神经网络有了一条副路径，其对应输出将有公式（5）变成如下所示的公式（6）

$a^{[l+2]} = g(z^{[l+2]}+a^{[l]}) \tag{6}$
此时的输入除了原先的输入 $a^{[l+2]}$ 外，多了一个 $a^{[l]}$ 项，即由于 $a^{[l]}$ 产生了一个残差块。

构建一个ResNet网络就是将很多这样的残差块堆积在一起，形成一个深度神经网络，如下所示：

使用传统的标准优化算法训练一个网络，随着网络深度的增加，训练误差会先减小再增加，随着网络层数的增加，优化算法会越难以训练，训练误差也会越来越多。但是，使用ResNet网络，能够有效地避免这种情况。

对残差网络的理解

如上所述，加入残差网络之后，其输出计算公式如公式（6）所示，展开这个公式，则有：
$a^{[l+2]} = g(W^{[l+2]}a^{[l+1]}+b^{[l+2]}+a^{[l]}) \tag{7}$

如果使用L2正则化或者权重衰减，则会压缩权重参数 $W^{[l+2]}$ 的值，如果参数 $W^{[l+2]}$ 和参数 $b^{[l+2]}$ 等于0，其输出将由公式（7）变成 $a^{[l+2]} = g(a^{[l]})$ ，假定使用ReLU激活函数，则有： $a^{[l+2]} = a^{[l]}$

由于残差网络存在的这种跳跃连接，很容易得出以上等式，这意味着，即使给神经网络增加两层，但是其效率并不逊色与更简单的神经网络。并且由于存在以上恒等式，使得网络学习隐藏层的单元的信息更加容易。而普通网络，随着网络层数的增加，学习参数会变得很困难。

此外，关于残差网络，如公式（6）所示，假设 $z^{[l+2]}$ 与 $a^{[l]}$ 具有相同的维度，由于ResNets使用了许多same卷积， $a^{[l]}$ 的维度等于输出层的维度。如果输入和输出具有不同的维度，可以再增加一个矩阵 $W_s$ ，使得 $W_s*a^{[l]}$ 和 $a^{[l+2]}$ 具有相同的维度。而 $W_s$ 的维度可以通过0值填充调节。

1×1的卷积网络

在卷积网络的架构设计中，一种有趣的想法是会使用到1×1的过滤矩阵，实际上，对于单通道的图像而言，1×1的过滤矩阵，意义不大，但是，对于多通道的图像而言，1×1的过滤矩阵能够有效减少图像卷积之后的通道数量。

根据卷积和池化的基本知识，随着神经网络层数的增加，图像的通道数量会逐渐增加，采用1×1的过滤矩阵卷积之后，可以有效减少图像的通道数量，一个简单的示例，如下所示：

假设有一个6×6×32的图片，使用1×1×32的过滤矩阵进行卷积运算，整个运算过程将会遍历36个单元格，并计算过滤矩阵所覆盖区域的元素积之和，将其应用到ReLu非线性函数，会得到一个输出值。此计算过程中，可能会用到多个1×1×32的过滤器，那么，通过以上计算会得到一个6×6×过滤器数量的矩阵。

Inception网络

构建卷积神经网络时，有时会很难决定过滤器的大小，而Inception网络的引入，却能很好的解决这个问题。

Inception网络的作用就是代替人工确定选择卷积层的过滤器类型。如下图所示，对于一个多通道图像，可以使用不同的过滤矩阵或者池化层，得到不同的输出，将这些输出堆积起来。

有了如上图所示的Inception块，最终输出为32+32+64+128=256，而Inception模块的输入为28×28×192，其整个计算成本，以5×5的过滤矩阵为例，其乘法的计算次数为：28×28×32×5×5×192，整个计算次数超过了1.2亿次。而如果使用如下所示的优化计算方法，则可以有效减少计算量。

如果利用1×1的过滤器，将输入矩阵的通道减少至16，则可以有效减少计算量，如下所示：

如上图所示的价格中，整个网络的运算次数为：28×28×192×16+28×28×32×5×5×16=1240万，整个计算成本降低至原来的十分之一。而，通过1×1×192过滤器卷积得到的这个网络层被称之为瓶颈层。

如上，所示，可以给每一个非1×1的卷积层之前，加入一个1×1的瓶颈层，就可以构建一个基本的inception模块了，如下图所示：

而一个inception网络就是多个Inception模块连接起来，如下图所示：

事实上，以上网络中，还存在一些分支，如编号1所示，这些分支就是全连接层，而全连接层之后就是一个softmax层用于预测。又如分支2所示，包含一些隐藏层（编号3），通过全连接层和softmax进行预测。这些分支结构能够确保，即使是隐藏层和中间层也参与了特征计算，并且也能够预测图片的分类。这种做法能够有效避免网络过拟合。

数据增强

对于计算机视觉领域而言，神经网络的训练可能需要大量的数据，但是当数据量有限时，可以通过数据增强来实现数据量的扩充，以提高系统的鲁棒性，具体的数据增强方法如下所示：

镜像翻转
随机裁剪
颜色转换(RGB通道增加不同的失真值)

除了以上三种数据增强的方法外，更多的数据增强方法和实现可以参考图像数据增强

数据增强可以利用计算机多线程实现，一个线程用来实现加载数据，实现数据增强，其他线程可以训练这些数据以加快整体的运算速度。

CNN学习笔记
卷积神经网络-CNN 卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习（deep learn...
AI数学基础33-深度卷积网络在学什么？
深度卷积网络在学什么？-- 待续
一文带你认识深度学习中不同类型的卷积
卷积（convolution）现在可能是深度学习中最重要的概念。靠着卷积和卷积神经网络（CNN）,深度学习超越了几...
Convolution Network and Applicat
吴恩达的深度学习课程中的卷积网络部分卷积网络使用卷积相当于提取图片的边缘特征，利用深度学习改变滤波器让其可以...
无知的一些入门的东西
1、卷积网络的发展深度学习——卷积神经网络的经典网络（LeNet-5、AlexNet、ZFNet、VGG-16、...
各种卷积网络（转）
原:万字长文带你看尽深度学习中的各种卷积网络卷积 VS 互关联深度学习中的卷积网络（单通道版，多通道版） 3D...
《解析卷积神经网络—深度学习实践手册.pdf》PDF高清完整版-
《解析卷积神经网络—深度学习实践手册.pdf》PDF高清完整版-免费下载《解析卷积神经网络—深度学习实践手册.p...
深度卷积网络
经典网络 LeNet网络 LeNet网络的结构如下图所示，可以看出，LeNet网络并没有使用padding，每进行...
深度学习中的各种卷积操作
吐槽：为啥简书不支持[TOC]生成目录深度学习中的各种卷积操作 1、深度学习中的卷积操作在神经网络中，卷积...
Keras深度学习实践3—计算机视觉问题：猫vs狗
内容参考以及代码整理自“深度学习四大名“著之一《Python深度学习》一、卷积神经网络卷积神经网络，也叫con...

深度卷积网络

经典网络

LeNet网络

AlexNet

VGG-16

残差网络（ResNets：Residual　Networks）

对残差网络的理解

1×1的卷积网络

Inception网络

数据增强

相关文章

CNN学习笔记

AI数学基础33-深度卷积网络在学什么？

一文带你认识深度学习中不同类型的卷积

Convolution Network and Applicat

无知的一些入门的东西

各种卷积网络（转）

《解析卷积神经网络—深度学习实践手册.pdf》PDF高清完整版-