族谱网 头条 人物百科

梯度下降法

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:420
转发:0
评论:0
描述梯度下降法的描述。梯度下降方法基于以下的观察:如果实值函数F(x){displaystyleF(mathbf{x})}在点a{displaystylemathbf{a}}处可微且有定义,那么函数F(x){displaystyleF(mathbf{x})}在a{displaystyl

描述

梯度下降法

梯度下降法的描述。

梯度下降方法基于以下的观察:如果实值函数F(x){\displaystyle F(\mathbf {x} )}在点a{\displaystyle \mathbf {a} }处可微且有定义,那么函数F(x){\displaystyle F(\mathbf {x} )}在a{\displaystyle \mathbf {a} }点沿着梯度相反的方向 − − -->∇ ∇ -->F(a){\displaystyle -\nabla F(\mathbf {a} )} 下降最快。

因而,如果

对于γ γ -->>0{\displaystyle \gamma >0}为一个够小数值时成立,那么F(a)≥ ≥ -->F(b){\displaystyle F(\mathbf {a} )\geq F(\mathbf {b} )}。

考虑到这一点,我们可以从函数F{\displaystyle F}的局部极小值的初始估计x0{\displaystyle \mathbf {x} _{0}}出发,并考虑如下序列 x0,x1,x2,… … -->{\displaystyle \mathbf {x} _{0},\mathbf {x} _{1},\mathbf {x} _{2},\dots }使得

因此可得到

如果顺利的话序列(xn){\displaystyle (\mathbf {x} _{n})}收敛到期望的极值。注意每次迭代步长γ γ -->{\displaystyle \gamma }可以改变。

右侧的图片示例了这一过程,这里假设F{\displaystyle F}定义在平面上,并且函数图像是一个碗形。蓝色的曲线是等高线(水平集),即函数F{\displaystyle F}为常数的集合构成的曲线。红色的箭头指向该点梯度的反方向。(一点处的梯度方向与通过该点的等高线垂直)。沿着梯度下降方向,将最终到达碗底,即函数F{\displaystyle F}值最小的点。

例子

梯度下降法处理一些复杂的非线性函数会出现问题,例如Rosenbrock函数

其最小值在(x,y)=(1,1){\displaystyle (x,y)=(1,1)}处,数值为f(x,y)=0{\displaystyle f(x,y)=0}。但是此函数具有狭窄弯曲的山谷,最小值(x,y)=(1,1){\displaystyle (x,y)=(1,1)}就在这些山谷之中,并且谷底很平。优化过程是之字形的向极小值点靠近,速度非常缓慢。

下面这个例子也鲜明的示例了"之字"的上升(非下降),这个例子用梯度上升(非梯度下降)法求F(x,y)=sin⁡ ⁡ -->(12x2− − -->14y2+3)cos⁡ ⁡ -->(2x+1− − -->ey){\displaystyle F(x,y)=\sin \left({\frac {1}{2}}x^{2}-{\frac {1}{4}}y^{2}+3\right)\cos(2x+1-e^{y})}的极大值(非极小值,实际是局部极大值)。

缺点

梯度下降法的缺点包括:

靠近极小值时速度减慢。

直线搜索可能会产生一些问题。

可能会“之字型”地下降。

上述例子也已体现出了这些缺点。

参阅

参考文献

Mordecai Avriel (2003). Nonlinear Programming: Analysis and Methods. Dover Publishing. ISBN 0-486-43227-0.

Jan A. Snyman (2005). Practical Mathematical Optimization: An Introduction to Basic Optimization Theory and Classical and New Gradient-Based Algorithms. Springer Publishing. ISBN 0-387-24348-8


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱

相关资料

展开
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 梯度
梯度的解释假设有一个房间,房间内所有点的温度由一个标量场ϕϕ-->{\displaystyle\phi}给出的,即点(x,y,z){\displaystyle(x,y,z)}的温度是ϕϕ-->(x,y,z){\displaystyle\phi(x,y,z)}。假设温度不随时间改变。然后,在房间的每一点,该点的梯度将显示变热最快的方向。梯度的大小将表示在该速度上变热的速度。考虑一座高度在(x,y){\displaystyle(x,y)}点是H(x,y){\displaystyleH(x,y)}的山。H{\displaystyleH}这一点的梯度是在该点坡度(或者说斜度)最陡的方向。梯度的大小告诉我们坡度到底有多陡。梯度也可以告诉我们一个数量在不是最快变化方向的其他方向的变化速度。再次考虑山坡的例子。可以有条直接上山的路其坡度是最大的,则其坡度是梯度的大小。也可以有一条和上坡方向成...
· 共轭梯度法
方法的表述设我们要求解下列线性系统其中n-×-n矩阵A是对称的(也即,A=A),正定的(也即,xAx>0对于所有非0向量x属于R),并且是实系数的。将系统的唯一解记作x*。最后算法经过一些简化,可以得到下列求解Ax=b的算法,其中A是实对称正定矩阵。相关共轭梯度法的推导非线性共轭梯度法(英语:Nonlinearconjugategradientmethod)参考共轭梯度法最初出现于MagnusR.HestenesandEduardStiefel(1952),Methodsofconjugategradientsforsolvinglinearsystems,J.ResearchNat.Bur.Standards49,409–436.下列教科书中可以找到该方法的描述KendellA.Atkinson(1988),Anintroductiontonumericalanalys...
· 温度梯度
数学的叙述假设温度T是一个集约数量,即是在三度空间(通常称为标量场)内的一个单值连续的和可微分的函数,也就是说,此处x,y和z是座标系的位置标示,温度梯度是向量,其定义如下:天气和气候的关联不同地区之间的空气温度差异对天气预报与气候至关重要。行星表面对太阳光的吸收增强了温度梯度,其结果造成对流(云形成的主要过程,经常与降水相关联)。相似的,在全球和年度的基础上,大气(和海洋)的动力学可以被理解为试图通过极地和赤道的温度差异极大的冷空气和暖空气(包括水)在广大的区域重新配置。天气图是温度梯度在水平方向上可以达到较高数值的地区,这些是具有相当明显属性气团之间的边界。很明显的,温度梯度会随着时间变化,一天之中或季节性的冷热变或都会使温度梯度产生变化。逐日的经验和环境问题其它可以明确的感受到温度梯度的场所包括在夏天有空调商店的入口(或出口),或山洞的入口,以及其他受到保护或空气不流通的场所。气温快...
· 电化学梯度
参见动作电位电扩散(英语:Electrodiffusion)伽凡尼电池电化电池离子交换膜(英语:Protonexchangemembrane)参考文献Campbell&Reece.Biology.PearsonBenjaminCummings.2005.ISBN0-8053-7146-X.StephenT.Abedon,"ImportantwordsandconceptsfromChapter8,Campbell&Reece,2002(1/14/2005)",forBiology113attheOhioStateUniversity
· 陛下、殿下、阁下的区别
陛下、殿下、阁下的区别陛,原指帝王宫殿的台阶。“陛下”是臣僚谒见帝王时所处的地点和位置。后来,可能是臣僚们为表示对帝王的恭敬而用的一种称谓。因为臣僚们见帝王常用陛下一词,慢慢就转变成了对帝王的尊称。“殿下”一般是对太子、亲王、皇太后、皇后的尊称。他们生活起居在宫殿之中,故有此称谓。“阁下”一词盛行于唐代,当时是对高级官员的尊称。因为古代高级官员的官署往往称阁,如龙图阁、天禄阁、东阁、文渊阁等等,故以阁下相称。

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信