最優化理論中的對偶(duality)或對偶性原則(duality principle)是指最佳化問題可以用兩種觀點來看待的理論,兩種觀點分別是「原始問題」(primal problem)及「對偶問題」(dual problem)。對偶問題的解提供了原始問題(假設是最小化問題)的下限[1],不過一般而言,原始問題和對偶問題的最佳解不相同。兩個最佳解的差距為對偶間隙。若是凸優化問題,對偶間隙也稱為是卡魯什-庫恩-塔克條件

對偶問題

一般而言「對偶問題」是指「拉格朗日對偶問題」(Lagrangian dual problem),不過也有其他的對偶問題,例如Wolfe對偶問題英語Wolfe dual problemFenchel對偶問題英語Fenchel's duality theorem。拉格朗日對偶問題是指在最小化問題上加上拉格朗日乘數,也就是在目標函數上加上對應限制條件的非負拉格朗日乘數,再求解可將原目標函數最小的原始變數值。此解會得到以拉格朗日乘數的函數表示的原始變數,稱為是「對偶變數」(dual variables),因此,新的問題就是要衍生對偶變數的限制下(包括非負的限制條件),找到可以使目標函數最大化的對偶變數。

一般而言,給定二個對偶對英語dual pair分隔局部凸空間英語locally convex space ,以及函數,可以定義原始問題為找到使得 換句話說,若存在,是函數最小極值(minimum),也可以得到函數的最大下界(infimum)。

若有限制條件,可以整合到函數中,方式是令,其中是在上的適當函數,在限制條件上有最小值0,可以證明。後者的條件很明顯,但不一定很方便可以符合示性函數(也就是說,滿足限制條件的,在其他情形,)。因此可以將延伸為擾動函數英語perturbation function使得[2]

對偶間隙就是不等式

左側和右側的差。

其中是二個變數的凸共軛,而上確界[2][3][4]

線性規劃

線性規劃問題是指損失函數約束都是線性關係最優化問題。原始問題中,目標函數是n個變數的線性組合,問題有m個約束,每一個都有上限,上限由n個變數的線性組合表示。其目的是要在滿足限制條件的情形下,最大化目標函數的值。其解是由n個值表示的向量,可以讓目標函數有最大值。

在對偶問題中,目標函數是m個值的線性組合,這些是原始問題中m個限制條件的上下限。有n個對偶限制條件,每一個的下限都是由m個對偶變數的線性組合所表示。

原始問題和對偶問題的關係

針對線性的最佳化問題,在原始問題中每一個符合限制條件的次佳點,都有一個方向(或方向的子空間),可以往目標函數增加的方向移動。若往這類的方向移動,稱為除去候選解英語candidate solution和一個或多個限制之間的鬆弛量(slack)。候選解中不可行的值即為超過一個或多個限制的值。

在對偶問題中,會將對偶向量和限制條件相乘,這些限制條件會決定原始問題中限制條件的位置。在對偶問題中變動對偶向量類似在原始問題中調整上限。要找到最小的上限。也就是說,要將對偶向量最小化,以移除限制的候選位置和實際最佳解之間的鬆弛量(slack)。對偶向量中的不可行值是指哪些太低的值。這會讓候選解的一個或多個限制條件落在排除實際最佳解的位置。

線性規劃中探討對偶性的方程式中,會對上述直覺有型式化的敘述。

非線性規劃

非線性規劃中的限制條件不一定是線性的,不過許多線性規劃的原則還是適用。

為了確保可以簡單的識別非線性規劃中的全域最大值,問題一般會要求函數要是凸函數,而且有緊緻的lower level sets。

由此可以看出卡魯什-庫恩-塔克條件的重要性。卡魯什-庫恩-塔克條件可以提供非線性規劃問題中識別局部最佳值的必要條件。也有一些額外的必要條件(約束規範,constraint qualifications)可以用來判斷可能有「最佳解」(是局部最佳解,但不一定是全域最佳解)的方式。

強拉格朗日原則:拉格朗日對偶

考慮以下形式的非線性規劃:

其定義域有非空的內部。其拉格朗日函數定義為

向量是有關此問題的「對偶變數」(dual variables)或拉格朗日乘數向量(Lagrange multiplier vectors)。拉格朗日對偶函數(Lagrange dual function)定義如下

對偶函數g是凹函數,就算初始問題不是凸也會如此,因為是仿射函數的點狀最大下界。對偶函數提供初始問題最佳值的下界:針對任意及任意,可以得到

若滿足約束規範(例如斯萊特條件英語Slater's condition),且原問題是凸,則可以得到強對偶英語strong duality

凸問題

針對有不等式限制的凸最小化問題

拉格朗日對偶問題為

其中目標函數是拉格朗日對偶函數。假設函數 and 連續可微,最大下界出現在梯度等於零的位置。問題

稱為Wolfe對偶問題。此問題用計算的方式處理可能會很困難,因為目標函數在聯合變數上不是凹。而且,一般而言,等式的限制條件也是非線性的,因此Wolfe對偶問題一般而言會不會是凸最佳化問題。不論如何,弱對偶英語weak duality會成立[5]

歷史

依照喬治·伯納德·丹齊格所述,在丹齊格提出了線性規劃問題後,約翰·馮·諾伊曼就提出了線性規劃的對偶性定理的猜想。馮·諾伊曼注意到他使用了來自其博弈論中的資訊,並且猜想兩人零和的矩陣博弈和線性規劃等效。嚴謹的證明最早是由阿爾伯特·塔克和其團隊發表(丹齊格在Nering和塔克1993年著作中的前言)

相關條目

腳註

參考資料

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.