Loading AI tools
物理原理 来自维基百科,自由的百科全书
在物理學裏, 作用量原理(英語:actions principle),或更精確地,平穩作用量原理(英語:stationary action principle),是一種變分原理,當應用於一個機械系統的作用量時,可以得到此機械系統的運動方程式。這原理的研究引導出經典力學的拉格朗日表述和哈密頓表述的發展。卡爾·雅可比特稱最小作用量原理為分析力學之母[1]。
在現代物理學裏,這原理非常重要,在相對論、量子力學、量子場論裏,都有廣泛的用途。在現代數學裏,這原理是莫爾斯理論的研究焦點。本篇文章主要是在闡述最小作用量原理的歷史發展。關於數學描述、推導和實用方法,請參閱條目作用量。最小作用量原理有很多種例子,主要的例子是莫佩爾蒂原理(Maupertuis' principle)和哈密頓原理。
在最小作用量原理之前,有很多類似的點子出現於測量學和光學。古埃及的拉繩測量者在測量兩點之間的距離時,會將固定於這兩點的繩索拉緊,這樣,可以使間隔距離減少至最低值[2]。托勒密在他的著作《地理學指南》(Geographia)第一冊第二章裏強調,測量者必須對於直線路線的誤差做出適當的修正。古希臘數學家歐幾里得在《反射光學》(Catoptrica)裏表明,將光線照射於鏡子,則光線的反射路徑的入射角等於反射角。稍後,亞歷山卓的希羅證明這路徑的長度是最短的[3]。
1662年,皮埃爾·德·費馬提出費馬原理,又稱為「最短時間原理」:光線移動的路徑是需時最少的路徑[4]。
費馬原理更正確的版本應是「平穩時間原理」。對於某些狀況,光線移動的路徑所需的時間可能不是最小值,而是最大值,或甚至是拐值。例如,對於平面鏡,任意兩點的反射路徑光程是最小值;對於半橢圓形鏡子,其兩個焦點的光線反射路徑不是唯一的,光程都一樣,是最大值,也是最小值;對於半圓形鏡子,其兩個端點Q、P的反射路徑光程是最大值;又如最右圖所示,對於由四分之一圓形鏡與平面鏡組合而成的鏡子,同樣這兩個點Q、P的反射路徑的光程是拐值。[5]
假設,介質1、介質2的折射率分別為、,光線從介質1在點O移動進入介質2,則斯涅耳定律以方程式表達為
其中,為入射角,為折射角。
從費馬原理,可以推導出斯涅耳定律。通過設定光程對於時間的導數為零,可以找到「平穩路徑」,這就是光線移動的路徑。光線在介質1與介質2的速度分別為
其中,是真空光速。
由於介質會減緩光線的速度,折射率和都大於。
如右圖所示,從點Q到點P的移動時間為
根據費馬原理,光線移動的路徑是所需時間為極值的路徑,取移動時間對變數的導數,設定其為零:
由圖中的邊角關係,可以得到移動速度與折射角的關係式:
將移動速度與折射率的關係式代入,就會得到斯涅耳定律:
費馬原理引發了極大的爭議。假若介質的密度越小,光線的移動速度越快,則費馬原理是正確的;但是,艾薩克·牛頓和勒內·笛卡兒都認為介質的密度越大,光線的移動速度就越快。1802年,托馬斯·楊做實驗發現,當光波從較低密度介質移動進入較高密度介質之後,光波的波長會變短,他因此推論光波的運動速度會降低。[5]
最小作用量原理應用於作用量的最初始表述,時常歸功於皮埃爾·莫佩爾蒂。於1744年和1746年,他寫出一些關於這方面的論文[6][7]。但是,史學專家指出,這優先聲明並不明確。萊昂哈德·歐拉在他的1744年論文裏就已談到這原理[8]。還有一些考據顯示出,在1705年,戈特弗里德·萊布尼茨就已經發現這原理了[9]。
莫佩爾蒂發表的最小作用量原理闡明,對於所有的自然現象,作用量趨向於最小值。他定義一個運動中的物體的作用量為,物體質量、移動速度與移動距離的乘積[10]:
莫佩爾蒂又從宇宙論的觀點來論述,最小作用量好像是一種經濟原理。在經濟學裏,大概就是精省資源的意思。這論述的瑕疵是,並沒有任何理由,能夠解釋,為什麼作用量趨向最小值,而不是最大值。假若,我們解釋最小作用量為大自然的精省資源,那麼,我們又怎樣解釋最大作用量呢?
於1744年,在巴黎科學院發表的一篇論文《幾種以前互不相容的自然定律的合一論》(Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles)中,莫佩爾蒂提出,光折射的路徑,從一種介質到另一種介質,是作用量的最小值。按照這論點,如前圖,假設光線從折射率為的介質1折射於折射率為介質2,則作用量為
其中,是光線的質量。雖然光線並沒有質量,這變量對於結果沒有任何影響,可以被忽略。
取作用量對於變數的導數,設定為零,經過一些運算,可以得到
請注意,這結果與牛頓的光粒子理論相符合;但是,與費馬得到的結果南轅北轍,大不相同。
1747年,莫佩爾蒂在柏林科學院(Academy of Berlin)發表了論文《運動與靜止定律》(Loix du mouvement et du repos)。在這篇論文裏,他將碰撞分為兩種,彈性碰撞與非彈性碰撞。彈性碰撞遵守動量守恆和能量守恆;非彈性碰撞只遵守動量守恆。莫佩爾蒂可以將最小作用量原理應用於彈性碰撞與非彈性碰撞,正確地計算出碰撞後的物體的速度。
思考一個一維非彈性碰撞,假設兩個質量分別為和的物體O1和物體O2,分別以初始速度和朝着同一方向移動,而且,,物體O1緊追着物體O2。當兩物體發生非彈性碰撞後,結合成為物體O3,以終結速度移動。從固定於物體O3的參考系觀察,物體O1和物體O2的速度分別為和。所以,作用量為
其中,是時間。
取作用量對於變數的導數,設定為零,經過一些運算,可以得到
所以,最終速度為
請注意,按照這種設定參考系的方法,前面折射問題的光折射作用量應該是
還有,前面光折射作用量的距離參數是任意值,但是,非彈性碰撞作用量的碰撞前距離參數與碰撞後距離參數被設定為相等。
由於這些不一致之處,促使恩斯特·馬赫嚴厲批評,莫佩爾蒂的最小作用量原理只是一個模糊不清的概念,勉強地被用來解釋各種不同的物理現象[11]。
1744年,萊昂哈德·歐拉在論文《尋找具有極大值或極小值性質的曲線,等周問題的最廣義解答》(Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti)裏,以非常清楚的字句,給出最小作用量原理的定義[12]:
設定一個質量為,速度為的粒子移動無窮小距離。這粒子的動量為,當乘以無窮小距離時,會給出,粒子的動量積分於無窮小距離。現在,我宣明,這移動粒子的真實軌道(在所有連結兩個端點的可能軌道之中)是為最小值的軌道,或者,假定質量是個常數,是為最小值的軌道。
如同歐拉所寫,是動量積分於移動路徑。採用現代術語,這積分等於簡略作用量;其中,是廣義動量,是廣義坐標。因此,在同一年,稍微比莫佩爾蒂晚一點,歐拉獨立地發表了,與莫佩爾蒂的理論等同的,關於變分原理的理論。歐拉並沒有爭奪優先榮譽。
假設沒有任何作用力施加於這粒子,則這粒子以均勻速度移動:
只有在軌道長度為最小值時,才能得到作用量最小值。這軌道是一條直線。
假設這移動於二維空間的粒子感受到均勻重力,則根據活力定律(principle of vis viva),
其中,是瞬時速度,是最初速度,是粒子朝着y-軸移動的距離,是加速度常數。
將這方程式代入作用量:
令,求作用量的穩定值,應用變分法,可以得到歐拉-拉格朗日方程式:
其中,是積分常數。
重新編排,可以得到
將這方程式積分,
其中,是積分常數。
假設粒子的初始位置為,初始速度為,則
重新編排,可以看出這是拋物線方程式:
歐拉又將這結果推廣至一群粒子。他認為最小作用原理所以正確,是因為粒子的慣性試着阻抗任何關於狀態的改變,自由粒子會選擇遵循影響最小的作用力[4]。
約瑟夫·拉格朗日對於變分法貢獻良多。拉格朗日在論文《分析力學》(Mecanique Analytique)裏,從能量守恆定律理論推導出歐拉表述的最小作用量原理是正確的[4]。能量守恆定律以方程式表達為
位能的變分為
其中,是粒子的位置,是虛位移。
粒子感受到的作用力為位能的負梯度。將牛頓第二定律帶入方程式,
微分運算可以和變分運算對易:
其中,是粒子的速度。
所以,位能的變分為
動能的變分為
總能量的變分為:
總能量的積分的變分為
其中,是路徑長度。
設定路徑的兩個端點為固定不變,能量也守恆不變,則粒子移動的路徑的作用量是穩定值:
推廣至位形空間,拉格朗日最小作用量原理闡明,
拉格朗日又注意到在作用量的方程式中,
將這方程式代入作用量,可以看見被積分項目是動能項目:
因此,作用量也可以表達為(忽略常數乘法因子)
歐拉-拉格朗日最小作用量原理表明,描述粒子運動的作用量必定是穩定值[13]:
請特別注意,這方程式看起來簡易精緻,然而,隱藏在使用方面有很大的問題。歐拉的作用量積分於路徑;而這作用量積分於時間。變分法要求積分域兩端固定不變。雖然路徑兩端是固定值,轉換至時間,為了要滿足能量守恆,時間間隔的兩端可能不是固定值。亞可比因此批評拉格朗日的方法有瑕疵[13]。後來,於1816年,奧淩迪·若立格(Olinde Rodrigues)想出新點子,將這時間作用量的變分詳細計算出來[1]。
作用量記作,定義為時刻t1、t2之間拉格朗日量L的積分——是N廣義坐標q = (q1, q2, ... , qN)的泛函,其中坐標是時間的函數,定義了系統的位形空間:
點表示時間導數,t是時間。
數學原理為[15][16] 其中δ是微小變化。換句話說就是:[14]
常作用並不總是最小作用。[17][18]:19-6它是有限維系統路徑中足夠短的有限段的最小原則。[19]
在應用中,作用的陳述與定義結合在一起:[20]
作用與拉格朗日量都包含了系統在所有時間的動力特性。「路徑」是指系統在位形空間中畫出的曲線,即以時間為參數的曲線q(t)(關於這一概念,另見參數方程式)。
約瑟夫·拉格朗日於1760年[21][22]提出了變分法的大部分內容,並將其應用於動力學問題。在《動力分析》(1788)中,拉格朗日推導出了機械體的一般運動方程式。[23]威廉·哈密頓在1834、1835年[24]將變分法應用於經典拉格朗日函數得到了目前形式的歐拉-拉格朗日方程式。
卡爾·雅可比於1842年解決了變分法是否總能找到最小值而非其他駐點(最大值或鞍點)的問題,他的大部分工作集中於二維曲面的測地線上。[25]馬斯頓·莫爾斯在1920年代到30年代首次給出了明確的一般性陳述,[26]形成了莫爾斯理論。例如,莫爾斯證明了軌跡中共軛點數等於拉格朗日二次變分中負特徵值的數量。康斯坦丁·卡拉西奧多里對歐拉-拉格朗日方程式進行了非常優雅的推導,發表於1935年。
其他經典力學的極值原理有高斯最小約束原理及其推論——赫茲最小曲率原理。
對於具有非完整約束的系統,哈密頓原理被達朗貝爾原理代替。這時,作用量被強加為只在符合約束的變化時靜止。
微分運動方程式數學等價於其對應的積分運動方程式,這具有很重要的哲學意義。微分方程式描述局部於空間的一點或單獨時間的片刻。舉例而言,牛頓第二定律解釋為瞬時作用力施加於質量為的粒子會造成瞬時加速度為的運動。明顯對比地,作用量原理不會局部於一點,而牽涉到積分於一段時間間隔或一個空間的局域。更重要地,通常在經典作用量原理的表述裏,系統的初始狀態和終結狀態是固定不變的,也就是說,
特別地針對這程序,終結狀態的固定動作似乎額外地賦予了作用量原理一些目的論的特色。在物理學史裏,這特色不經意地製造出很多激烈的爭論。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.