博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Deep Residual Network
阅读量:4677 次
发布时间:2019-06-09

本文共 544 字,大约阅读时间需要 1 分钟。

最近在看的一篇论文中使用来了残差网络的结构,所以来了解一下残差网络的工作原理。残差网络的深度可以达到令人发指的深度,具体有多牛逼我也不多说了。

背景

大家都知道更深的网络能够产生更好的效果,但是训练一个很深的网络却一直是一个难题,主要原因有如下几点:梯度消失、尺度不均匀的初始化。为了解决这些问题,许多研究者也提出了很多种解决办法,但是并没有很好的解决问题。何恺明发现了下面这种状况:

 

随着网络深度的增加,网络性能反而下降,而且不仅仅是测试误差增大,训练误差也更大,说明这并不是由过拟合导致的。这种现象是不合理的。假设目前有一个效果很好的网络A,这是构建一个比A更深的网络B,那么让B的前一部分与A完全相同,后面的网络层只实现恒等映射,这样B最差查会得到跟A一样的网络性能,而不会比A更差。这也是深度残差网络的思想,既然B后面的部分完全是恒等映射,则可以在训练网络的时候加上这一先验信息,于是在构造网络的时候加入了shortcut链接,即每层的输出不是传统神经网络当中输入的映射,而是映射和输入的叠加。如下图:

 

 

本文参考了http://caffecn.cn/?/article/4

 

转载于:https://www.cnblogs.com/claude-gyh/p/6565564.html

你可能感兴趣的文章
设计模式系列 - 访问者模式
查看>>
20180507小测
查看>>
前端鼠标点击弹出浮动文字--民主、和谐、爱国、自由等
查看>>
eclipse左侧不见
查看>>
python会缓存小的整数和短小的字符
查看>>
格网与四叉树索引
查看>>
Linux网卡配置文件路径是什么?要使服务器上外网,必须满足的条件有哪些?需要配置什么?...
查看>>
多张照片拍摄、图片浏览
查看>>
html(5) css
查看>>
微信小程序时间戳 页面中时间戳转成自己需要的格式(支持列表循环等)
查看>>
CSS笔记2
查看>>
Azure Web连接到Azure MySql Db
查看>>
Python2快速入门教程,只需要这十五张图片就够了!
查看>>
cdoj 1131 男神的礼物 区间dp
查看>>
美白、磨皮、搞笑图片处理
查看>>
C/C++代码覆盖工具gcov与lcov入门
查看>>
[12/11/19] 折半&倍增思想学习笔记
查看>>
关于endnote与word或wps关联的问题
查看>>
分块打表
查看>>
uva 297 - Quadtrees
查看>>