🍉Book-5章-神经网络

787 字
4 分钟
🍉Book-5章-神经网络

神经网络模型#

1943年一直沿用至今的M-P神经网络模型

M-P神经网络模型#

模型解释#

将输入神经元的x乘上相应==权重w==并求和,将结果与==阈值==θ\theta做差,再经过==激活函数f==得到输出值y

名词解释#

阈值(threshold / bias): 表示神经元电位超过阈值则被激活

激活函数(activation function): 也称挤压函数响应函数,用于将输入值映射为0/1或(0,1)

训练目标#

通过训练模型,得出合适的w和θ\theta,其中训练算法最常见的就是下面会说到的BP算法

激活函数#

回顾第三章线性模型中的对数几率回归模型和单位阶跃函数

最理想状态是用==单位阶跃函数==输入值映射为0/1,但由于其不连续、不光滑的性质, 我们使用==Sigmoid函数==将输入值映射为(0,1),Sigmoid函数即型为S的函数,其中我们最常用的就是对数几率函数: sigmoid(x)=11+ex s i g m o i d ( x ) = \frac { 1 } { 1 + e ^ { - x } } 对率函数有很好的==性质==:f(x)=f(x)(1f(x)) f ^ { \prime } ( x ) = f \left( x \right) ( 1 - f \left( x \right) )

万有逼近能力#

名词概念:#

仅需一个包含足够多神经元的隐层,多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数

引入原因:#

很多算法都具有万有逼近能力,不是神经网络所特有的,如决策树、支持向量机等等。 而之所以在神经网络中强调其万有逼近能力,是因为其数学公理方面的理论薄弱,为了证明其有效性而进行说明。

BP算法#

误差逆传播(error BackPropagation,简称BP)算法,亦称反向传播算法

BP算法是一种迭代算法,基于==梯度下降==(gradient descent)策略, 数学推导过程不多做阐述,详见西瓜书or南瓜书

缓解过拟合#

由于神经网络强大的表示能力,其经常容易过拟合,为此我们有以下两种策略

1.早停(early stopping)#

将数据集分为训练集和验证集,若验证集得到的误差升高,则停止训练。

但是很显然神经网络的误差可能是细微的波动,但却造成了训练的停止,有点像决策树中的预剪枝,基于贪心的策略。

所以采用:

  • 若训练误差连续α轮的变化小于b,则停止训练使用验证集
  • 若训练误差降低、验证误差升高,则停止训练

2.正则化(regularization)#

在误差目标函数中增加一项描述网络复杂度

E=λ1mk=1mEk+(1λ)iwi2 E = \lambda \frac { 1 } { m } \sum _ { k = 1 } ^ { m } E _ { k } + ( 1 - \lambda ) \sum _ { i } w _ { i } ^ { 2 }

偏好比较小的连接权和阀值,使网络输出更“光滑”

支持与分享

如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!

赞助
🍉Book-5章-神经网络
https://hp-patience.github.io/posts/watermelon-book-ch5/
作者
Celyn
发布于
2024-05-16
许可协议
CC BY-NC-SA 4.0

评论区

Profile Image of the Author
Profile Image of the Author
Celyn
费曼学习法,反思近期所学并反馈输出,将所学知识内化。
公告
欢迎来到 Celyn 的博客!专注于AI大模型、深度学习与编程技术分享。
音乐
封面

音乐

暂未播放

0:00 0:00
暂无歌词
分类
标签
站点统计
文章
23
分类
9
标签
22
总字数
29,378
运行时长
0
最后活动
0 天前

文章目录