最小作用量原理
费马的表述
光线从点Q传播至点O时,会被半圆形或混合形镜子反射,最终抵达点P。
1662年,皮埃尔·德·费马提出费马原理,又称为“最短时间原理”:光线移动的路径是需时最少的路径 。
费马原理更正确的版本应是“平稳时间原理”。对于某些状况,光线移动的路径所需的时间可能不是最小值,而是最大值,或甚至是拐值。例如,对于平面镜,任意两点的反射路径光程是最小值;对于半椭圆形镜子,其两个焦点的光线反射路径不是唯一的,光程都一样,是最大值,也是最小值;对于半圆形镜子,其两个端点Q、P的反射路径光程是最大值;又如最右图所示,对于由四分之一圆形镜与平面镜组合而成的镜子,同样这两个点Q、P的反射路径的光程是拐值。
假设,介质1、介质2的折射率分别为 n 1 {\displaystyle n_{1}} 、 n 2 {\displaystyle n_{2}} ,光线从介质1在点O移动进入介质2,则斯涅尔定律以方程表达为
其中, θ θ --> 1 {\displaystyle \theta _{1}} 为入射角, θ θ --> 2 {\displaystyle \theta _{2}} 为折射角。
光线从介质1的点Q,在点O移动进入介质2,发生折射,最后抵达介质2的点P。
从费马原理,可以推导出斯涅尔定律。通过设定光程对于时间的导数为零,可以找到“平稳路径”,这就是光线移动的路径。光线在介质1与介质2的速度分别为
其中, c {\displaystyle c} 是真空光速。
由于介质会减缓光线的速度,折射率 n 1 {\displaystyle n_{1}} 和 n 2 {\displaystyle n_{2}} 都大于 1 {\displaystyle 1} 。
如右图所示,从点Q到点P的移动时间 T {\displaystyle T} 为
根据费马原理,光线移动的路径是所需时间为极值的路径,取移动时间 T {\displaystyle T} 对变数 x {\displaystyle x} 的导数,设定其为零:
由图中的边角关系,可以得到移动速度与折射角的关系式:
将移动速度与折射率的关系式代入,就会得到斯涅尔定律:
费马原理引发了极大的争议。假若介质的密度越小,光线的移动速度越快,则费马原理是正确的;但是,艾萨克·牛顿和勒内·笛卡儿都认为介质的密度越大,光线的移动速度就越快。1802年,托马斯·杨做实验发现,当光波从较低密度介质移动进入较高密度介质之后,光波的波长会变短,他因此推论光波的运动速度会降低。
莫佩尔蒂的表述
最小作用量原理应用于作用量的最初始表述,时常归功于皮埃尔·莫佩尔蒂。于1744年和1746年,他写出一些关于这方面的论文 。但是,史学专家指出,这优先声明并不明确。莱昂哈德·欧拉在他的1744年论文里就已谈到这原理 。还有一些考据显示出,在1705年,戈特弗里德·莱布尼茨就已经发现这原理了 。
莫佩尔蒂发表的最小作用量原理阐明,对于所有的自然现象,作用量趋向于最小值。他定义一个运动中的物体的作用量为 A {\displaystyle A} ,物体质量 m {\displaystyle m} 、移动速度 v {\displaystyle v} 与移动距离 s {\displaystyle s} 的乘积 :
莫佩尔蒂又从宇宙论的观点来论述,最小作用量好像是一种经济原理。在经济学里,大概就是 精省资源 的意思。这论述的瑕疵是,并没有任何理由,能够解释,为什么作用量趋向最小值,而不是最大值。假若,我们解释最小作用量为大自然的精省资源,那么,我们又怎样解释最大作用量呢?
折射理论
于1744年,在巴黎科学院发表的一篇论文《几种以前互不相容的自然定律的合一论》( Accord de plusieurs lois naturelles qui avaient paru jusqu"ici incompatibles )中,莫佩尔蒂提出,光折射的路径,从一种介质到另一种介质,是作用量的最小值。按照这论点,如前图,假设光线从折射率为 n 1 {\displaystyle n_{1}} 的介质1折射于折射率为 n 2 {\displaystyle n_{2}} 介质2,则作用量为
其中, m {\displaystyle m} 是光线的质量。虽然光线并没有质量,这变量对于结果没有任何影响,可以被忽略。
取作用量对于变数 x {\displaystyle x} 的导数,设定为零,经过一些运算,可以得到
请注意,这结果与牛顿的光粒子理论相符合;但是,与费马得到的结果南辕北辙,大不相同。
非弹性碰撞
1747年,莫佩尔蒂在伯林科学院( Academy of Berlin )发表了论文《运动与静止定律》( Loix du mouvement et du repos )。在这篇论文里,他将碰撞分为两种,弹性碰撞与非弹性碰撞。弹性碰撞遵守动量守恒和能量守恒;非弹性碰撞只遵守动量守恒。莫佩尔蒂可以将最小作用量原理应用于弹性碰撞与非弹性碰撞,正确地计算出碰撞后的物体的速度。
思考一个一维非弹性碰撞,假设两个质量分别为 m 1 {\displaystyle m_{1}} 和 m 2 {\displaystyle m_{2}} 的物体O 1 和物体O 2 ,分别以初始速度 v 1 {\displaystyle v_{1}} 和 v 2 {\displaystyle v_{2}} 朝着同一方向移动,而且, v 1 > v 2 {\displaystyle v_{1}>v_{2}} ,物体O 1 紧追着物体O 2 。当两物体发生非弹性碰撞后,结合成为物体O 3 ,以终结速度 v 3 {\displaystyle v_{3}} 移动。从固定于物体O 3 的参考系观察,物体O 1 和物体O 2 的速度分别为 v 1 − − --> v 3 {\displaystyle v_{1}-v_{3}} 和 v 2 − − --> v 3 {\displaystyle v_{2}-v_{3}} 。所以,作用量为
其中, t {\displaystyle t} 是时间。
取作用量对于变数 v 3 {\displaystyle v_{3}} 的导数,设定为零,经过一些运算,可以得到
所以,最终速度为
请注意,按照这种设定参考系的方法,前面折射问题的光折射作用量应该是
还有,前面光折射作用量的距离参数是任意值,但是,非弹性碰撞作用量的碰撞前距离参数与碰撞后距离参数被设定为相等。
由于这些不一致之处,促使恩斯特·马赫严厉批评,莫佩尔蒂的最小作用量原理只是一个模糊不清的概念,勉强地被用来解释各种不同的物理现象 。
欧拉的表述
1744年,莱昂哈德·欧拉在论文《寻找具有极大值或极小值性质的曲线,等周问题的最广答》( Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti )里,以非常清楚的字句,给出最小作用量原理的定义 :
如同欧拉所写, ∫ ∫ --> M v d s {\displaystyle \int Mv\,\mathrm {d} s} 是动量积分于移动路径。采用现代术语,这积分等于简略作用量 ∫ ∫ --> p ⋅ ⋅ --> d q {\displaystyle \int \mathbf {p} \cdot \,\mathrm {d} \mathbf {q} } ;其中, p {\displaystyle \mathbf {p} } 是广义动量, q {\displaystyle \mathbf {q} } 是广义坐标。因此,在同一年,稍微比莫佩尔蒂晚一点,欧拉独立地发表了,与莫佩尔蒂变分原理同的,关于变分原理的理论。欧拉并没有争夺优先荣誉。
直线运动
假设没有任何作用力施加于这粒子,则这粒子以均匀速度移动:
只有在轨道长度 s {\displaystyle s} 为最小值时,才能得到作用量最小值。这轨道是一条直线。
抛物线运动
假设这移动于二维空间的粒子感受到均匀引力 F = M g y ^ ^ --> {\displaystyle \mathbf {F} =Mg{\hat {\mathbf {y} }}} ,则根据活力定律( principle of vis viva ),
其中, v {\displaystyle v} 是瞬时速度, v 0 {\displaystyle v_{0}} 是最初速度, y {\displaystyle y} 是粒子朝着y-轴移动的距离, g {\displaystyle g} 是加速度常数。
将这方程代入作用量:
令 δ δ --> A = 0 {\displaystyle \delta A=0} ,求作用量的稳定值,应用变分法,可欧拉-拉格朗日方程日方程:
其中, k 1 {\displaystyle k_{1}} 是积分常数。
重新编排,可以得到
将这方程积分,
其中, k 2 {\displaystyle k_{2}} 是积分常数。
假设粒子的初始位置为 ( 0 , 0 ) {\displaystyle (0,0)} ,初始速度为 ( 0 , v 0 ) {\displaystyle (0,v_{0})} ,则
重新编排,可以看出这是抛物线方程:
欧拉又将这结果推广至一群粒子。他认为最小作用原理所以正确,是因为粒子的惯性试着阻抗任何关于状态的改变,自由粒子会选择遵循影响最小的作用力 。
拉格朗日的表述
约瑟夫·拉格朗日对于变分法贡献良多。拉格朗日在论文《分析力学》( Mecanique Analytique )里,从能量守恒定律理论推导出欧拉表述的最小作用量原理是正确的 。能量守恒定律以方程表达为
其中, E {\displaystyle E} 是总能量, T {\displaystyle T} 是动能, V {\displaystyle V} 为势能。
势能的变分为
其中, r {\displaystyle \mathbf {r} } 是粒子的位置, δ δ --> r {\displaystyle \delta \mathbf {r} } 是虚位移。
粒子感受到的作用力 F {\displaystyle \mathbf {F} } 为势能的负梯度。将牛顿第二定律带入方程,
微分运算可以和变分运算对易:
其中, v {\displaystyle \mathbf {v} } 是粒子的速度。
所以,势能的变分为
动能的变分为
总能量的变分为:
总能量的积分的变分为
其中, d s {\displaystyle \mathrm {d} s} 是路径长度。
设定路径的两个端点为固定不变,能量也守恒不变,则粒子移动的路径的作用量是稳定值:
拉格朗日最小作用量原理
推广至位形空间,拉格朗日最小作用量原理阐明,
其中, p i {\displaystyle p_{i}} 是广义动量, q i {\displaystyle q_{i}} 是广义坐标。
欧拉-拉格朗日最小作用量原理
拉格朗日又注意到在作用量的方程 A = ∫ ∫ --> M v d s {\displaystyle A=\int Mv\,\mathrm {d} s} 中,
将这方程代入作用量,可以看见被积分项目是动能项目:
因此,作用量也可以表达为(忽略常数乘法因子)
欧拉-拉格朗日最小作用量原理表明,描述粒子运动的作用量必定是稳定值 :
请特别注意,这方程看起来简易精致,然而,隐藏在使用方面有很大的问题。欧拉的作用量积分于路径;而这作用量积分于时间。变分法要求积分域两端固定不变。虽然路径两端是固定值,转换至时间,为了要满足能量守恒,时间间隔的两端可能不是固定值。亚可比因此批评拉格朗日的方法有瑕疵 。后来,于1816年,奥凌迪·若立格( Olinde Rodrigues )想出新点子,将这时间作用量的变分详细计算出来 。
表观目的论
微分运动方程数学等价于其对应的积分运动方程,这具有很重要的哲学意义。微分方程描述局部于空间的一点或单独时间的片刻。举例而言,牛顿第二定律 F = m a {\displaystyle \mathbf {F} =m\mathbf {a} } 解释为瞬时作用力 F {\displaystyle \mathbf {F} } 施加于质量为 m {\displaystyle m} 的粒子会造成瞬时加速度为 a {\displaystyle \mathbf {a} } 的运动。明显对比地,作用量原理不会局部于一点,而牵涉到积分于一段时间间隔或一个空间的局域。更重要地,通常在经典作用量原理的表述里,系统的初始状态和终结状态是固定不变的,也就是说,
特别地针对这程序, 终结状态的固定动作似乎额外地赋予了作用量原理一些目的论的特色。 在物理学史里,这特色不经意地制造出很多激烈的争论。
参阅
变分法
活力 (物理)( vis viva )
高斯最小约束原理( Gauss" principle of least constraint )
赫兹最小曲率原理( Hertz"s principle of least curvature )
雅可比原理( Jacobi"s principle )
参考文献
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值