Loading AI tools
物理原理 来自维基百科,自由的百科全书
在物理学里, 作用量原理(英语:actions principle),或更精确地,平稳作用量原理(英语:stationary action principle),是一种变分原理,当应用于一个机械系统的作用量时,可以得到此机械系统的运动方程式。这原理的研究引导出经典力学的拉格朗日表述和哈密顿表述的发展。卡尔·雅可比特称最小作用量原理为分析力学之母[1]。
在现代物理学里,这原理非常重要,在相对论、量子力学、量子场论里,都有广泛的用途。在现代数学里,这原理是莫尔斯理论的研究焦点。本篇文章主要是在阐述最小作用量原理的历史发展。关于数学描述、推导和实用方法,请参阅条目作用量。最小作用量原理有很多种例子,主要的例子是莫佩尔蒂原理(Maupertuis' principle)和哈密顿原理。
在最小作用量原理之前,有很多类似的点子出现于测量学和光学。古埃及的拉绳测量者在测量两点之间的距离时,会将固定于这两点的绳索拉紧,这样,可以使间隔距离减少至最低值[2]。托勒密在他的著作《地理学指南》(Geographia)第一册第二章里强调,测量者必须对于直线路线的误差做出适当的修正。古希腊数学家欧几里得在《反射光学》(Catoptrica)里表明,将光线照射于镜子,则光线的反射路径的入射角等于反射角。稍后,亚历山卓的希罗证明这路径的长度是最短的[3]。
1662年,皮埃尔·德·费马提出费马原理,又称为“最短时间原理”:光线移动的路径是需时最少的路径[4]。
费马原理更正确的版本应是“平稳时间原理”。对于某些状况,光线移动的路径所需的时间可能不是最小值,而是最大值,或甚至是拐值。例如,对于平面镜,任意两点的反射路径光程是最小值;对于半椭圆形镜子,其两个焦点的光线反射路径不是唯一的,光程都一样,是最大值,也是最小值;对于半圆形镜子,其两个端点Q、P的反射路径光程是最大值;又如最右图所示,对于由四分之一圆形镜与平面镜组合而成的镜子,同样这两个点Q、P的反射路径的光程是拐值。[5]
假设,介质1、介质2的折射率分别为、,光线从介质1在点O移动进入介质2,则司乃耳定律以方程式表达为
其中,为入射角,为折射角。
从费马原理,可以推导出司乃耳定律。通过设定光程对于时间的导数为零,可以找到“平稳路径”,这就是光线移动的路径。光线在介质1与介质2的速度分别为
其中,是真空光速。
由于介质会减缓光线的速度,折射率和都大于。
如右图所示,从点Q到点P的移动时间为
根据费马原理,光线移动的路径是所需时间为极值的路径,取移动时间对变数的导数,设定其为零:
由图中的边角关系,可以得到移动速度与折射角的关系式:
将移动速度与折射率的关系式代入,就会得到司乃耳定律:
费马原理引发了极大的争议。假若介质的密度越小,光线的移动速度越快,则费马原理是正确的;但是,艾萨克·牛顿和勒内·笛卡儿都认为介质的密度越大,光线的移动速度就越快。1802年,托马斯·杨做实验发现,当光波从较低密度介质移动进入较高密度介质之后,光波的波长会变短,他因此推论光波的运动速度会降低。[5]
最小作用量原理应用于作用量的最初始表述,时常归功于皮埃尔·莫佩尔蒂。于1744年和1746年,他写出一些关于这方面的论文[6][7]。但是,史学专家指出,这优先声明并不明确。莱昂哈德·欧拉在他的1744年论文里就已谈到这原理[8]。还有一些考据显示出,在1705年,戈特弗里德·莱布尼茨就已经发现这原理了[9]。
莫佩尔蒂发表的最小作用量原理阐明,对于所有的自然现象,作用量趋向于最小值。他定义一个运动中的物体的作用量为,物体质量、移动速度与移动距离的乘积[10]:
莫佩尔蒂又从宇宙论的观点来论述,最小作用量好像是一种经济原理。在经济学里,大概就是精省资源的意思。这论述的瑕疵是,并没有任何理由,能够解释,为什么作用量趋向最小值,而不是最大值。假若,我们解释最小作用量为大自然的精省资源,那么,我们又怎样解释最大作用量呢?
于1744年,在巴黎科学院发表的一篇论文《几种以前互不相容的自然定律的合一论》(Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles)中,莫佩尔蒂提出,光折射的路径,从一种介质到另一种介质,是作用量的最小值。按照这论点,如前图,假设光线从折射率为的介质1折射于折射率为介质2,则作用量为
其中,是光线的质量。虽然光线并没有质量,这变量对于结果没有任何影响,可以被忽略。
取作用量对于变数的导数,设定为零,经过一些运算,可以得到
请注意,这结果与牛顿的光粒子理论相符合;但是,与费马得到的结果南辕北辙,大不相同。
1747年,莫佩尔蒂在柏林科学院(Academy of Berlin)发表了论文《运动与静止定律》(Loix du mouvement et du repos)。在这篇论文里,他将碰撞分为两种,弹性碰撞与非弹性碰撞。弹性碰撞遵守动量守恒和能量守恒;非弹性碰撞只遵守动量守恒。莫佩尔蒂可以将最小作用量原理应用于弹性碰撞与非弹性碰撞,正确地计算出碰撞后的物体的速度。
思考一个一维非弹性碰撞,假设两个质量分别为和的物体O1和物体O2,分别以初始速度和朝著同一方向移动,而且,,物体O1紧追著物体O2。当两物体发生非弹性碰撞后,结合成为物体O3,以终结速度移动。从固定于物体O3的参考系观察,物体O1和物体O2的速度分别为和。所以,作用量为
其中,是时间。
取作用量对于变数的导数,设定为零,经过一些运算,可以得到
所以,最终速度为
请注意,按照这种设定参考系的方法,前面折射问题的光折射作用量应该是
还有,前面光折射作用量的距离参数是任意值,但是,非弹性碰撞作用量的碰撞前距离参数与碰撞后距离参数被设定为相等。
由于这些不一致之处,促使恩斯特·马赫严厉批评,莫佩尔蒂的最小作用量原理只是一个模糊不清的概念,勉强地被用来解释各种不同的物理现象[11]。
1744年,莱昂哈德·欧拉在论文《寻找具有极大值或极小值性质的曲线,等周问题的最广义解答》(Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti)里,以非常清楚的字句,给出最小作用量原理的定义[12]:
设定一个质量为,速度为的粒子移动无穷小距离。这粒子的动量为,当乘以无穷小距离时,会给出,粒子的动量积分于无穷小距离。现在,我宣明,这移动粒子的真实轨道(在所有连结两个端点的可能轨道之中)是为最小值的轨道,或者,假定质量是个常数,是为最小值的轨道。
如同欧拉所写,是动量积分于移动路径。采用现代术语,这积分等于简略作用量;其中,是广义动量,是广义坐标。因此,在同一年,稍微比莫佩尔蒂晚一点,欧拉独立地发表了,与莫佩尔蒂的理论等同的,关于变分原理的理论。欧拉并没有争夺优先荣誉。
假设没有任何作用力施加于这粒子,则这粒子以均匀速度移动:
只有在轨道长度为最小值时,才能得到作用量最小值。这轨道是一条直线。
假设这移动于二维空间的粒子感受到均匀重力,则根据活力定律(principle of vis viva),
其中,是瞬时速度,是最初速度,是粒子朝著y-轴移动的距离,是加速度常数。
将这方程式代入作用量:
令,求作用量的稳定值,应用变分法,可以得到欧拉-拉格朗日方程式:
其中,是积分常数。
重新编排,可以得到
将这方程式积分,
其中,是积分常数。
假设粒子的初始位置为,初始速度为,则
重新编排,可以看出这是抛物线方程式:
欧拉又将这结果推广至一群粒子。他认为最小作用原理所以正确,是因为粒子的惯性试著阻抗任何关于状态的改变,自由粒子会选择遵循影响最小的作用力[4]。
约瑟夫·拉格朗日对于变分法贡献良多。拉格朗日在论文《分析力学》(Mecanique Analytique)里,从能量守恒定律理论推导出欧拉表述的最小作用量原理是正确的[4]。能量守恒定律以方程式表达为
势能的变分为
其中,是粒子的位置,是虚位移。
粒子感受到的作用力为势能的负梯度。将牛顿第二定律带入方程式,
微分运算可以和变分运算对易:
其中,是粒子的速度。
所以,势能的变分为
动能的变分为
总能量的变分为:
总能量的积分的变分为
其中,是路径长度。
设定路径的两个端点为固定不变,能量也守恒不变,则粒子移动的路径的作用量是稳定值:
推广至位形空间,拉格朗日最小作用量原理阐明,
拉格朗日又注意到在作用量的方程式中,
将这方程式代入作用量,可以看见被积分项目是动能项目:
因此,作用量也可以表达为(忽略常数乘法因子)
欧拉-拉格朗日最小作用量原理表明,描述粒子运动的作用量必定是稳定值[13]:
请特别注意,这方程式看起来简易精致,然而,隐藏在使用方面有很大的问题。欧拉的作用量积分于路径;而这作用量积分于时间。变分法要求积分域两端固定不变。虽然路径两端是固定值,转换至时间,为了要满足能量守恒,时间间隔的两端可能不是固定值。亚可比因此批评拉格朗日的方法有瑕疵[13]。后来,于1816年,奥凌迪·若立格(Olinde Rodrigues)想出新点子,将这时间作用量的变分详细计算出来[1]。
作用量记作,定义为时刻t1、t2之间拉格朗日量L的积分——是N广义坐标q = (q1, q2, ... , qN)的泛函,其中坐标是时间的函数,定义了系统的位形空间:
点表示时间导数,t是时间。
数学原理为[15][16] 其中δ是微小变化。换句话说就是:[14]
常作用并不总是最小作用。[17][18]:19-6它是有限维系统路径中足够短的有限段的最小原则。[19]
在应用中,作用的陈述与定义结合在一起:[20]
作用与拉格朗日量都包含了系统在所有时间的动力特性。“路径”是指系统在位形空间中画出的曲线,即以时间为参数的曲线q(t)(关于这一概念,另见参数方程)。
约瑟夫·拉格朗日于1760年[21][22]提出了变分法的大部分内容,并将其应用于动力学问题。在《动力分析》(1788)中,拉格朗日推导出了机械体的一般运动方程。[23]威廉·哈密顿在1834、1835年[24]将变分法应用于经典拉格朗日函数得到了目前形式的欧拉-拉格朗日方程。
卡尔·雅可比于1842年解决了变分法是否总能找到最小值而非其他驻点(最大值或鞍点)的问题,他的大部分工作集中于二维曲面的测地线上。[25]马斯顿·莫尔斯在1920年代到30年代首次给出了明确的一般性陈述,[26]形成了莫尔斯理论。例如,莫尔斯证明了轨迹中共轭点数等于拉格朗日二次变分中负特征值的数量。康斯坦丁·卡拉西奥多里对欧拉-拉格朗日方程进行了非常优雅的推导,发表于1935年。
其他经典力学的极值原理有高斯最小约束原理及其推论——赫兹最小曲率原理。
对于具有非完整约束的系统,哈密顿原理被达朗贝尔原理代替。这时,作用量被强加为只在符合约束的变化时静止。
微分运动方程式数学等价于其对应的积分运动方程式,这具有很重要的哲学意义。微分方程式描述局部于空间的一点或单独时间的片刻。举例而言,牛顿第二定律解释为瞬时作用力施加于质量为的粒子会造成瞬时加速度为的运动。明显对比地,作用量原理不会局部于一点,而牵涉到积分于一段时间间隔或一个空间的局域。更重要地,通常在经典作用量原理的表述里,系统的初始状态和终结状态是固定不变的,也就是说,
特别地针对这程序,终结状态的固定动作似乎额外地赋予了作用量原理一些目的论的特色。在物理学史里,这特色不经意地制造出很多激烈的争论。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.