【深度学习笔记】5.卷积神经网络

时间：2023-01-20 20:00:00 fci连接器10075025

CNN

CNN（Convolutional Neural Networks，CNN）中文名称卷积神经网络。

通常，当我们使用全连接神经网络时，权重矩阵的参数非常多。它使整个网络收敛非常缓慢。然而，自然图像处理具有局部不变性的特点，即尺度缩放、平移、旋转等操作不影响其语义信息，但全连接前馈网络难以提取这些局部不变性特征。所以介绍CNN。

CNN也是前馈神经网络，它最大的区别是受生物学上感受野的启发，引入了卷积核的概念。

卷积

卷积是一种连续卷积和离散卷积的计算方法。
$\begin{cases} (f*g)(n)=\int_{-\infty}^{\infty}f(\tau)g(n-\tau)d\tau \\ n=\tau (n-\tau) (f*g)(n)=\sum^{\infty}_{\tau=-\infty}f(\tau)g(n-\tau) \end{cases}$
卷积有很多应用，经常用于处理一个输入，通过系统产生一个适应需求的输出。是用于计算信号的延迟累计的一种手段

统计学中加权平均法
概率论中两个独立变量之和概率密度的计算
信号处理中的线性系统
物理学的线性系统
图像处理中的应用(卷积神经网络)

例如，假设一个信号发生器每个时刻t产生一个信号x，其信息的衰减率为w。即在k-1个时间步长后，信息为原来的w倍。假设w_1=1,w_2=1/2,w_3=1/4，则时刻t收到的信号y_t为当前hi为当前时刻产生的信息和以前时刻延迟信息的叠加，即：
$y=1*x_t+1/2*x_{t-1}+1/4*x_{t-2} \\ =\omega_1*x_t+\omega_2*x_{t-1}+\omega_3*x_{t-2} \\ =\sum^{3}_{k=1} \omega_k*x_{t-k+1}$

其中w就是滤波器，也就是常说的卷积核（Convolution Kernel）

给定一个输入信号x和滤波器w，卷积输出为：
$y_y=\sum^{K}_{k=1}\omega_kx_{t-k+1}$
而不同的滤波器提取出来的序列也有不同：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YPAww0VG-1638018363661)(https://datawhalechina.github.io/unusual-deep-learning/PIC/5/3.png)]

步长与零

填充

下面引入滤波器的滑动步长S和零填充P：

卷积的结果按输出长度不同可分三类：

窄卷积：步长T=1，两端不补零P=0，卷积后输出长度是M-K+1
宽卷积：步长T=1，两端补零P=K-1，卷积后的长度是M+K-1
等宽卷积：步长T=1，两端补零P=(K-1)/2，卷积后输出长度M

在早期的文献中，卷积一般默认为窄卷积。而目前的文献中，卷积一般默认为等宽卷积。

卷积与图像

上面提到，卷积在图像处理中发挥着重要的左右。而图像一般是二维矩阵的形式输入神经网络中，因此我们需要使用二维卷积。

下面给出定义：一个输入信息X和滤波器W的二维卷积为Y=W*X，既
$y_{ij}=\sum^{U}_{u=1}\sum_{v=1}V\omega_{uv}x_{i-u+1,j-v+1}$
实际如下图：

下图直接表示卷积层的映射关系

多个卷积核的情况：下图是表示步长2、filter 3*3 、filter个数6、零填充 1的情形。

几乎很多实际应用都可以对应到这个问题上，都是在做这样一件事

1）输入对应着rgb图片

2）一旦输入的特征图个数是多个，这个时候每一组filter就应该是多个，而这里有两组filter

3）输入是三个特征图，输出为两个特征图，那么我们同样看看每个特征图怎么计算的。

典型的卷积层为3维结构

其他卷积

转置卷积/微步卷积

低维特征映射到高维特征

空洞卷积

为了增加输出单元的感受野，通过给卷积核插入“空洞”来变相地增加其大小。

卷积神经网络基本原理

一般的卷积神经网络基本结构包括：输入层、卷积层、激活函数、池化层、全连接层、输出层。当然，在某些特殊业务场景下，可能会基于简单的卷积网络结果添加其他的类似预训练模型、机器学习模型等操作。

下面将从卷积层开始介绍每一层的细节。

卷积层

二维卷积运算：给定二维的图片作为输入，卷积核为K，那么卷积的公式可以表示为：
$K)(i,j)=\sum_m\sum_nI(i-m,j-n)K(m,n)$
绝技和需要进行上下翻转和左右翻转，所以
$S(i,j)=(\left[ \begin{matrix} I(i-2,j-2) & I(i-2,j-1) & I(i-2,j)\\ I(i-1,j-2) & I(i-1,j-1) & I(i-1,j) \\ I(i,j-2) & I(i,j-1) & I(i,j)\end{matrix} \right]*\left[ \begin{matrix} K(2,2) & K(2,1) & K(2,0)\\ K(1,2) & K(1,1) & K(1,0) \\ K(0,2) & K(0,1) & K(0,0)\end{matrix} \right])$
卷积实际上就是互相关，其实更直接一点就是输入数据与卷积核对应“坐标”的每一格数据相乘的累加。