第七章——深度卷积神经网络

1. 卷积神经网络CNN

属于是经典中的经典啦~

模型	特点	年代
LeNet-1	(卷积)⇢(降采样)⇢(卷积)⇢(降采样)⇢(全连接），针对手写字符问题设计，后来被SVM超过	1990
AlexNet	使用局部感受野，权值共享，最大汇集等措施减少参数；数据扩增（利用预训练增加训练样本数目）	2012
VGG	使用较小的卷积核尺寸和降采样区域；网络提升到最多16-19层	2014
GoogleNet	用多个“起始单元”（inception）的小网络模块构成大网络;在基元中采用了多个1x1的卷积核，实现降维和减少计算量;在中间设置两处输出，作为训练辅助	2014
ResNet	相邻层合并为一个组合单元，每个单元设一个跨过几层网络的短路连接;𝒙 是本单元的输入，单元格内局部网络映射𝑭(𝒙, 𝒘)，是除信号自身外的一个“残差”（residual），则实际输出𝒚：𝒚 = 𝑭(𝒙, 𝒘) + 𝒙	2015
DenseNet	上一层得到的特征图不但输出到下一层，而是形成了跨层的密集连接;密集区块（Dense Block）：用较少的卷积核，并且大量是1x1 卷积核;进一步拓展为MSDNet：二维的神经网络阵列，并设有中间输出	2017
……

非线性激活函数

dropout

归一化batch normolization

解决问题：训练速度慢、梯度爆炸问题

核心思想：在批量梯度下降中设法使得每一批数据中的分布相同

对于神经网络的每一层输入做归一化运算：
$$
\vec{x_i}=\frac{x_i-u_x}{\sigma}
$$
还需要对特征尺度做调整和平移，提升特征表达能力：
$$
\vec{y_i}=\gamma\vec{x_i}+\beta
$$
数据增强

终止条件

Gao

https://ghy0202.github.io/2022/04/08/mo-shi-shi-bie-shen-du-juan-ji-shen-jing-wang-luo/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 Gao !

模式识别神经网络

2022-04-08 算法与数据结构

编程练习机考

2022-02-08 算法与数据结构

编程练习 PTA