深度学习网络(11)——训练神经网络

如何训练神经网络

m0_74259787 · 2024-12-28 12:06:14 发布

训练神经网络

对当前输入的感受野,只与滤波器的大小有关,与padding和stride无关,
对网络输入的感受野: $r0=∑l=1L((kl−1)∏i=1l−1si)+1r_0=\sum_{l=1}^L((k_l-1)\prod_{i=1}^{l-1}s_i)+1$

ReLU:max(0,x):

问题:

Leaky ReLU:
$y={x,x>00.01x,x≤0y=\begin{cases}x,x>0\\ 0.01 x,x\leq 0\end{cases}$
任何时候梯度都不会为0(神经元不会“死掉”)

输出以0为中心的好处:模型训练收敛更快

使用建议：使用ReLU，可以尝试Leaky ReLU，尽量避免使用sigmoid/tanh

$X′=X−μσX'=\frac{X-\mu}{\sigma}$ , $μ\mu$ 是训练集的均值, $σ\sigma$ 是训练集的标准差, $X^{'}$ 是归一化后的数据

将权重全部设置为一个常量的话:不管进行多少轮正向传播以及反向传播,每俩层之间的参数都是一样的。换句话说,本来我们希望不同的结点学习到不同的参数,但是由于参数相同以及输出值都一样,不同的结点根本无法学到不同的特征！！！这样就失去了网络学习特征的意义。

在模型训练的每次前向传播计算中,将一些神经元随即设置为0,让网络学习冗余表示,防止特征的协同适应

随机网络深度
训练时:随机跳过某些层
测试时:使用所有层

水平翻转、锐化、随即裁剪和缩放、颜色扰动

一站式 AI 云服务平台

更多推荐

国内低代码平台：2025 年国内主流平台盘点

5分钟搞定！MySQL/PostgreSQL 到 Elasticsearch 的实时同步

从零开始搭建个人RAG知识库：RAGFlow+DeepSeek保姆级教程！

查看更多评论

已为社区贡献3条内容