ラグランジュの未定乗数法

ウィキペディアから

ラグランジュの未定乗数法(ラグランジュのみていじょうすうほう、: method of Lagrange multiplier)とは、束縛条件のもとで最適化を行うための数学解析学)的な方法である。いくつかの変数に対して、いくつかの関数の値を固定するという束縛条件のもとで、別のある1つの関数の極値を求めるという問題を考える。各束縛条件に対して定数(未定乗数Lagrange multiplier)を用意し、これらを係数とする線形結合を新しい関数(未定乗数も新たな変数とする)として考えることで、束縛問題を普通の極値問題として解くことができる方法である。

定理

要約
視点

ラグランジュの未定乗数法は、次のような定理として記述される。

2次元の場合

束縛条件 g(x, y) = 0 の下で、f(x, y) が最大値となる点 (a , b) を求める問題、つまり

maximize
subject to

という問題を考える。ラグランジュ乗数λ とし、

とおく。点 (a, b)g/xg/y の少なくとも一方が 0 でないならば、α が存在して点 (a, b, α)

が成り立つ[1]

一般の多次元の場合

n 次元空間の点 x = (x1, …, xn) のある領域 R を定義域とする被評価関数 z = f(x) が、同じ領域を定義域とする m 次元ベクトル値関数

の下で、R 内の点 x において極値をとるための必要条件は、その点における f勾配ベクトル

が、その点で、m 個の gi それぞれの勾配ベクトルが張る m 次元線型部分空間に含まれること、すなわち、スカラーの組 λ = (λ1, …, λm) を用いて、

が成り立つことである。移項して を取れば、

停留点をとることである。ただし、{∇g1, …, ∇gm}一次独立、すなわち

でなければならない。式(1)の m 本と式(2)の n 本の式を連立させて、xλ(n + m) 個の未知数について解けば、f の極値を与える候補点が得られる[2]

解釈

要約
視点

幾何学的な説明

Thumb
図1:束縛条件 g (x,y ) = c に対して関数 f (x,y ) を最大化する場合。
Thumb
図2:図1の等高線地図。赤い線は束縛条件 g(x, y) = c を示す。青い線は f(x, y) の等高線。赤い線が青い等高線に接する点が解。

簡単のため2次元の場合を考えよう。g (x, y) = c(ここで c は与えられた定数である)という条件の下、関数 f (x, y) を最大化するものとしよう。f の値を高さとしたグラフを考えると、高さが df の等高線は f (x, y) = d で与えられる。ここで、任意の曲線に沿って移動する点を考えると、この点が等高線を横切る場合、必ず f (x, y) は増加、もしくは減少するが、この点が等高線に沿って移動する場合は f (x, y) は変化しないことが分かる。この条件と通常の極値の条件を合わせて考えれば、曲線上で f (x, y) が最大をとる点では、f の等高線の接線と曲線の接線が平行となっているか、f の勾配がゼロとなっていることが分かる。ここで g (x, y) = c の接線は、g の勾配ベクトル x,y g と直交し、また f の等高線 f (x, y) = d の接線は f の勾配ベクトル x,y f と直交することを踏まえると、前述の条件は

と書ける。ここで

である。定数 λf の勾配ベクトルと g の勾配ベクトルが平行ではあるが長さが一般に異なるために必要である。λ = 0 の場合、f (x, y) の勾配がゼロとなる条件になる。これは g (x, y) = c の曲線上にちょうど f の最大値があるため、曲線上で f (x,y ) が最大を取る点と通常の f (x, y ) の最大値が一致する場合である。

前述の式を変形すると

となることから、f λ g の極値を求めればいいことになる。

束縛条件のない問題への変換

次の類似した2つの問題を考える

問題A
が束縛条件を満たす条件下で、を極大にする点を求めよ。

問題B
を定数とし、を極大にする点を求めよ。

問題Aは、束縛条件が存在するため「各変数で偏微分して、偏微分係数がゼロになる点を求める」という解法が使えないのに対し、問題Bには束縛条件がないので、「各変数で偏微分して、偏微分係数がゼロになる点を求める」という解法が使える。ラグランジュの未定乗数法は、問題Aと問題Bが、実質的に同じであることを言うものである。

問題B→問題A
をあるについての問題Bの極大点とし、加えてを満たせば、は問題Aの解である。
なぜなら、の近傍でとなる点を考えると、
となるため、は問題Aの極大点でもある。

問題A→問題B
を問題Aの極大点とする。
を、を満たしを通る曲線とし、とする。
の関数と考える。

ただし、、「」はベクトルの内積である。
一方、の両辺をで微分すれば、
が言える。
を満たしを通るどのような曲線でも、は、のための極大点であり、
が言える。ただしは、曲線のでの接線ベクトルである。

が問題Aの極大点であれば、
を満たすどのようなについても、
である。

と仮定し、を、に平行な成分と、に垂直な成分に分解する。(方向の単位ベクトルをとすると、である。)
であるためとして代入すると、 、よって
このため、は平行である。

、(ただしを仮定した。)

このについて問題Bを考えると、であるため、 となり、全ての偏微分係数がゼロとなるため、は問題Bの極大点でもある。

変則版

要約
視点

2次元問題で、束縛条件が1つの場合には、以下のように連立方程式を作ってもよい:

ただしこの場合の λ は、もとの定理の λ とは異なる。

この変則版は、極値となる点で全微分 df = 0 となる方向と、dg = 0 となる方向が平行であることから導かれる。

応用例

要約
視点

物理学の問題を解くとき、ラグランジュの未定乗数は単なる方便ではなく、ある物理量を表すことが多い。

流体力学

流体力学において、非圧縮性流れナビエ-ストークス方程式を解く場合、圧力は速度ベクトル場が連続の式という束縛条件を満たすための未定乗数として求められる[3]。 連続の式を満たさない速度場 v* が与えられたとき、ここから連続の式 ·v = 0 を満たす速度場 v を求めることは、未定乗数(最終的に圧力場となる)を p として

を最小化する問題に置き換えられる。ここで Ω は速度場が定義されている領域である。

R を最小化する速度場を v+ とし、任意の微小変化 v = v+ + δv を考えると、発散定理を使って

δv の任意性より右辺第1項の括弧の中身が 0 であることと、·v+ = 0 から

というポアソン方程式が導かれ、これを解いて得られる p を用いて

より速度場が求められる。

情報理論

情報理論エントロピーが最大となる離散的確率分布を見出すことを考えよう。このときエントロピーは確率を変数とする関数で、

となる。もちろんこれらの確率の合計は1に等しく、束縛条件を表す関数は

となる。ラグランジュ乗数を用いてエントロピー最大の点を見つけよう。すべての i(1から n をとる)に対して次の条件が必要である:

従って

これら n 個の方程式から次の式が得られる:

これは、すべての pi が等しいということを示している(変数は λ だけだから)。

束縛条件 k pk = 1 を使って、

が分かる。すなわち、すべての事象が等確率の一様分布がエントロピー最大の分布である:つまり他のどんな確率分布の場合よりも、確率変数が実際に観測されたときに得られる情報量の期待値が大きいということである。

ミクロ経済学

制約条件を予算制約線、函数を効用関数、極値を最適消費点と置き換えることでミクロ経済学における最適消費点を求める事に利用される[4]。この際、ラグランジュの未定乗数は、貨幣の限界効用として解釈することができる。

統計力学

統計力学においては、統計集団があるエネルギー状態をとる確率を導出するために未定乗数法が用いられる。

解析力学

作用積分S[q] で与えられる物理系に n 個の拘束条件 ϕa(q, t) = 0, (a = 1, ..., n) が課せられているとき、この系の運動方程式は λa を未定乗数とする条件付き変分

により表される[5]。ここで δS/δq汎関数微分である。ラグランジュの運動方程式で表すなら、ラグランジアン

に置き換えることで拘束を考慮した運動方程式が得られる。

参考文献

関連項目

外部リンク

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.