線型代数学 におけるケイリー・ハミルトンの定理 (ケイリー・ハミルトンのていり、英 : Cayley–Hamilton theorem )、またはハミルトン・ケイリーの定理 とは、(実数 体や複素数 体などの)可換環 上の正方行列 は固有方程式 を満たすという定理 である。アーサー・ケイリー とウィリアム・ローワン・ハミルトン に因む。
王立協会フェロー ・アーサー・ケイリー (1821-1895) は19世紀のブリテンを代表する純粋数学者として広く知られている。ケイリーは1848年にダブリンに赴き、ハミルトンから発見者直々に四元数 の講義を受けている。のちにケイリーは、四元数に関する成果を出版する2番目となることによりハミルトンに印象付けた。
ケイリーは 3 次以下の行列に対して定理を証明したが、2 次の場合に対してだけ証明を発表した。一般の n 次の場合についてケイリーは「……、任意次数の行列という一般の場合に定理をきちんと証明する労を引き受ける必要を覚えない。」と述べている。
アイルランドの物理学・天文学・数学者ウィリアム・ローワン・ハミルトン (1805-1865) は米国科学アカデミー 初の外国人会員である。幾何学をいかにして研究すべきかについては対立する位置に立ちながらも、ハミルトンは常にケイリーと最良の関係を留めていた。
ハミルトンは四元数 に関する線型函数に対して、それ自身が満足するある種の方程式の存在を証明した。
n 次正方行列 A に対して、In を n 次単位行列 とすると、A の固有多項式 は
p
(
λ
)
:=
det
(
λ
I
n
−
A
)
{\displaystyle p(\lambda ):=\det(\lambda I_{n}-A)}
で定義される。ここで det は行列式 を表し、λ は係数環の元(スカラー )である。引数の行列は各成分が λ の 1 次式以下の多項式(1 次式または定数)だから、その行列式も λ の n 次モニック多項式 になる。ケイリー・ハミルトンの定理の主張は、固有多項式を行列多項式 と見れば A が零点 であること、すなわち上記の λ を行列 A で置き換えた計算結果が零行列 であること、すなわち
p
(
A
)
=
O
{\displaystyle p(A)=O}
の成立を述べるものである。
注 置き換えにおいて、λ の冪は、A の、行列の積 による冪に置き換わるから、特に p (λ ) の定数項は A 0 すなわち単位行列の定数倍に置き換わる。
定理により、特に An は、より低次の A の多項式で表されることが分かる。係数環が体 (英語版 ) のとき、ケイリー・ハミルトンの定理は「任意の正方行列 A の最小多項式 は A の固有多項式を整除 する(割り切る)」という主張に同値である。
この定理は1853年にハミルトンが初めて証明した(それは「非可換」環である四元数 を変数とする一次函数の逆を用いたものであった)。これは一般の定理において、実4 次または複素2 次という特別の場合に当たるものである。
ケイリー・ハミルトンの定理は、四元数係数の行列に対しても成立する[注 1] 。
1858年にケイリーは 3 次およびそれより小さい行列に関して定理を述べているが、証明は 2 次の場合のみを著している。一般の場合が初めて証明されたのは1878年でフロベニウス による。
1 次
1 次正方行列 A = (a ) に対し、その固有多項式は p (λ ) ≔ λ − a であり、p (A ) = (a ) − a ⋅ I 1 = (0) は明らかである。
2 次
2 次正方行列
A
=
(
a
b
c
d
)
{\displaystyle A={\begin{pmatrix}a&b\\c&d\end{pmatrix}}}
に対しては、固有多項式は
p (λ ) ≔ λ 2 − (a + d )λ + (ad − bc )
となり、ケイリー・ハミルトンの定理の述べるところによれば
p
(
A
)
=
A
2
−
(
a
+
d
)
A
+
(
a
d
−
b
c
)
I
2
=
(
0
0
0
0
)
{\displaystyle p(A)=A^{2}-(a+d)A+(ad-bc)I_{2}={\begin{pmatrix}0&0\\0&0\end{pmatrix}}}
が成り立つはずであるが、これは実際に A 2 の成分を具体的に書き出せば、確かに成り立っていることが確認できる。
この定理を証明するのに、固有多項式:
p
(
λ
)
=
det
(
λ
I
n
−
A
)
{\displaystyle p(\lambda )=\det(\lambda I_{n}-A)}
(1 )
の λ を A に置き換えて
p
(
A
)
=
det
(
A
I
n
−
A
)
=
det
(
A
−
A
)
=
0
{\displaystyle p(A)=\det(AI_{n}-A)=\det(A-A)=0}
(error )
を得るとするのは、明らかに誤った論法である。
この論法が誤りである理由は、第一に、上式 error の左辺は n 次正方行列、右辺はスカラーである 0 であり、(n = 1 でない限り)不合理である。
第二に、(1 ) の右辺の λ はスカラーだからこそ行列式として意味をもつものであり、行列式の展開の前に λ を A に置き換えると意味をなさなくなる。
様子が分かるように具体的に 2 次の場合をとらえると、
p
(
λ
)
=
|
λ
−
a
−
b
−
c
λ
−
d
|
{\displaystyle p(\lambda )={\begin{vmatrix}\lambda -a&-b\\-c&\lambda -d\end{vmatrix}}}
の λ を
A
=
(
a
b
c
d
)
{\displaystyle A={\begin{pmatrix}a&b\\c&d\end{pmatrix}}}
に置き換えても、行列式としての意味をなさなくなることが分かる。
ただし、スカラーであるところをスカラー行列(単位行列のスカラー倍)で置き換えた区分行列
(
(
a
b
c
d
)
−
a
I
2
−
b
I
2
−
c
I
2
(
a
b
c
d
)
−
d
I
2
)
=
(
0
b
−
b
0
c
d
−
a
0
−
b
−
c
0
a
−
d
b
0
−
c
c
0
)
{\displaystyle {\begin{pmatrix}{\begin{pmatrix}a&b\\c&d\end{pmatrix}}-aI_{2}&-bI_{2}\\-cI_{2}&{\begin{pmatrix}a&b\\c&d\end{pmatrix}}-dI_{2}\end{pmatrix}}=\left({\begin{array}{cc|cc}0&b&-b&0\\c&d-a&0&-b\\\hline -c&0&a-d&b\\0&-c&c&0\end{array}}\right)}
を考えるならば式としては有効で、この行列式は実際に 0 になるが、この行列が上記の論法で det の引数とした AIn − A でないことは明らかである。
あるいはまた、この論法が実際に成立していたと仮定した場合、それは行列式以外にもほかの任意の多重線型形式 についても成立しないといけないことになる(つまり任意の線型写像は零ベクトルを零ベクトルに写すのだから、AIn − A = O (零行列)は任意の多重線型形式で 0 に写る)。そのような多重線型形式として例えばパーマネント (permanent)[注 2] を使って q (λ ) ≔ perm(λ⋅ In − A ) とすれば、同じ論法で q (A ) = 0 が証明されなければならないわけだが、それは見るからに誤りである。実例として 2 次の場合を書けば、
perm
(
a
b
c
d
)
=
a
d
+
b
c
{\displaystyle \operatorname {perm} {\begin{pmatrix}a&b\\c&d\end{pmatrix}}=ad+bc}
であるから、
q
(
λ
)
=
perm
(
λ
I
2
−
A
)
=
λ
2
−
(
a
+
d
)
λ
+
(
a
d
+
b
c
)
{\displaystyle q(\lambda )=\operatorname {perm} (\lambda I_{2}-A)=\lambda ^{2}-(a+d)\lambda +(ad+bc)}
であり、これに A を代入した
q
(
A
)
=
A
2
−
(
a
+
d
)
A
+
(
a
d
+
b
c
)
I
2
=
(
2
b
c
0
0
2
b
c
)
{\displaystyle q(A)=A^{2}-(a+d)A+(ad+bc)I_{2}={\begin{pmatrix}2bc&0\\0&2bc\end{pmatrix}}}
は一般には零でない。
ケイリー・ハミルトンの定理の証明の中には、数以外を成分とする行列を用いて、あたかも error 式を用いた論法にある意味似た方法をとるものがあるが、その場合でも AIn は A と等しくなく、結論も異なる所へ到達する。
n 次正方行列の固有多項式:
p
(
t
)
=
t
n
+
c
n
−
1
t
n
−
1
+
⋯
+
c
1
t
+
c
0
{\displaystyle p(t)=t^{n}+c_{n-1}t^{n-1}+\dots +c_{1}t+c_{0}}
において、i 次の係数 ci は A の固有値たちのなす (n − i ) 次基本対称式 に等しい。特に、定数項(0 次の係数)c 0 は固有値の総乗ゆえそれは A の行列式 detA に等しい。
ニュートンの公式 (英語版 ) を用いると、基本対称式は冪和対称式 (英語版 ) で書き表せるから、上記の ci は固有値の冪和対称式
s
k
=
∑
i
=
1
n
λ
i
k
{\displaystyle s_{k}=\textstyle \sum \limits _{i=1}^{n}{\lambda _{i}}^{k}}
たちで表されると分かるが、
s
k
=
∑
i
=
1
n
λ
i
k
=
tr
A
k
{\displaystyle s_{k}=\textstyle \sum \limits _{i=1}^{n}{\lambda _{i}}^{k}=\operatorname {tr} A^{k}}
である。したがって、ci は Ak のトレース たちで書き表せる。特に
c
n
−
1
=
tr
A
{\displaystyle c_{n-1}=\operatorname {tr} A}
である。
行列式の計算および逆行列
ケイリー・ハミルトンの定理により、一般の n 次正則行列 A (つまり A の行列式は 0 でない)に対し、その逆行列 A − 1 は A の n − 1 次以下の行列多項式 で表せる。実際、
p
(
A
)
=
A
n
+
c
n
−
1
A
n
−
1
+
⋯
+
c
1
A
+
(
−
1
)
n
det
(
A
)
I
n
=
O
{\displaystyle p(A)=A^{n}+c_{n-1}A^{n-1}+\cdots +c_{1}A+(-1)^{n}\det(A)I_{n}=O}
(∗ )
式 (∗ ) において、定数項を移項すると
−
(
−
1
)
n
det
(
A
)
I
n
=
A
(
A
n
−
1
+
c
n
−
1
A
n
−
2
+
⋯
+
c
1
I
n
)
{\displaystyle -(-1)^{n}\det(A)I_{n}=A(A^{n-1}+c_{n-1}A^{n-2}+\cdots +c_{1}I_{n})}
両辺に A − 1 を掛けると
A
−
1
=
(
−
1
)
n
−
1
det
A
(
A
n
−
1
+
c
n
−
1
A
n
−
2
+
⋯
+
c
1
I
n
)
{\displaystyle A^{-1}={\frac {(-1)^{n-1}}{\det A}}(A^{n-1}+c_{n-1}A^{n-2}+\cdots +c_{1}I_{n})}
を得る。
一般に、係数 ci を与える公式が、完全指数型ベル多項式 によって
c
n
−
k
=
(
−
1
)
k
k
!
B
k
(
s
1
,
−
1
!
s
2
,
2
!
s
3
,
⋯
,
(
−
1
)
k
−
1
(
k
−
1
)
!
s
k
)
{\displaystyle c_{n-k}={\frac {(-1)^{k}}{k!}}B_{k}(s_{1},-1!s_{2},2!s_{3},\cdots ,(-1)^{k-1}(k-1)!s_{k})}
と与えられる[注 3] 。特に A の行列式は c 0 であるから、トレースを含む表示(トレース恒等式 (英語版 ) )として
det
(
A
)
=
1
n
!
B
n
(
s
1
,
−
1
!
s
2
,
2
!
s
3
,
⋯
,
(
−
1
)
n
−
1
(
n
−
1
)
!
s
n
)
{\displaystyle \det(A)={\frac {1}{n!}}B_{n}(s_{1},-1!s_{2},2!s_{3},\cdots ,(-1)^{n-1}(n-1)!s_{n})}
と書ける。同様に、
A
−
1
=
1
det
A
∑
k
=
0
n
−
1
(
−
1
)
n
+
k
−
1
A
n
−
k
−
1
k
!
B
k
(
s
1
,
−
1
!
s
2
,
2
!
s
3
,
⋯
,
(
−
1
)
k
−
1
(
k
−
1
)
!
s
k
)
{\displaystyle A^{-1}={\frac {1}{\det A}}\textstyle \sum \limits _{k=0}^{n-1}(-1)^{n+k-1}{\dfrac {A^{n-k-1}}{k!}}B_{k}(s_{1},-1!s_{2},2!s_{3},\cdots ,(-1)^{k-1}(k-1)!s_{k})}
なる表示もできる。
例えば、ベル多項式の最初の方は B 0 = 1, B 1 (x 1 ) = x 1 , B 2 (x 1 , x 2 ) = x 2 1 + x 2 , B 3 (x 1 , x 2 , x 3 ) = x 3 1 + 3x 1 x 2 + x 3 , … であるから、これらを用いて 2 次の場合の固有多項式の係数 ci を具体的に計算すれば
c
2
=
B
0
=
1
,
c
1
=
−
1
1
!
B
1
(
s
1
)
=
−
s
1
=
−
tr
(
A
)
c
0
=
1
2
!
B
2
(
s
1
,
−
1
!
s
2
)
=
1
2
(
s
1
2
−
s
2
)
=
1
2
(
(
tr
(
A
)
)
2
−
tr
(
A
2
)
)
{\displaystyle {\begin{aligned}&c_{2}=B_{0}=1,\quad c_{1}={\frac {-1}{1!}}B_{1}(s_{1})=-s_{1}=-\operatorname {tr} (A)\\&c_{0}={\frac {1}{2!}}B_{2}(s_{1},-1!s_{2})={\frac {1}{2}}(s_{1}^{2}-s_{2})={\frac {1}{2}}((\operatorname {tr} (A))^{2}-\operatorname {tr} (A^{2}))\end{aligned}}}
などとなる。ここで、c 0 は行列式であるから、この場合の逆行列を
A
−
1
=
−
1
det
A
(
A
+
c
1
I
2
)
=
−
2
(
A
−
tr
(
A
)
I
2
)
(
tr
(
A
)
)
2
−
tr
(
A
2
)
{\displaystyle A^{-1}={\frac {-1}{\det A}}(A+c_{1}I_{2})={\frac {-2(A-\operatorname {tr} (A)I_{2})}{(\operatorname {tr} (A))^{2}-\operatorname {tr} (A^{2})}}}
と計算することができる。
注
ここで出てきた式 1 / 2 ((trA )2 − tr(A 2 )) は、cn− k に対する(ベル多項式を用いた)一般式から出たものだから、n 次正方行列に対してもこれは常に λ n − 2 の係数 c n − 2 を与えるものとなっていることが一見して分かる。ゆえに特に、3 次正方行列 A に対するケイリー・ハミルトンの定理の主張を
A
3
−
(
tr
A
)
A
2
+
1
2
(
(
tr
A
)
2
−
tr
(
A
2
)
)
A
−
det
(
A
)
I
3
=
O
{\displaystyle A^{3}-(\operatorname {tr} A)A^{2}+{\frac {1}{2}}((\operatorname {tr} A)^{2}-\operatorname {tr} (A^{2}))A-\det(A)I_{3}=O}
と書くことができる。同様に の場合の行列式は今度は
det
(
A
)
=
1
3
!
B
3
(
s
1
,
−
1
!
s
2
,
2
!
s
3
)
=
1
6
(
s
1
3
+
3
s
1
(
−
s
2
)
+
2
s
3
)
=
1
6
(
(
tr
A
)
3
−
3
tr
(
A
2
)
(
tr
A
)
+
2
tr
(
A
3
)
)
{\displaystyle {\begin{aligned}\det(A)&={\frac {1}{3!}}B_{3}(s_{1},-1!s_{2},2!s_{3})={\frac {1}{6}}(s_{1}^{3}+3s_{1}(-s_{2})+2s_{3})\\&={\tfrac {1}{6}}((\operatorname {tr} A)^{3}-3\operatorname {tr} (A^{2})(\operatorname {tr} A)+2\operatorname {tr} (A^{3}))\end{aligned}}}
と書けるが、これはそのまま一般の場合の λ n − 3 の係数 c n − 3 を表す式として理解できる。ゆえにさらにこれを用いて 4 次正方行列 A に対する定理の主張は
A
4
−
(
tr
A
)
A
3
+
1
2
(
(
tr
A
)
2
−
tr
(
A
2
)
)
A
2
−
1
6
(
(
tr
A
)
3
−
3
tr
(
A
2
)
(
tr
A
)
+
2
tr
(
A
3
)
)
A
+
det
(
A
)
I
4
=
O
{\displaystyle A^{4}-(\operatorname {tr} A)A^{3}+{\tfrac {1}{2}}{\bigl (}(\operatorname {tr} A)^{2}-\operatorname {tr} (A^{2}){\bigr )}A^{2}-{\tfrac {1}{6}}{\bigl (}(\operatorname {tr} A)^{3}-3\operatorname {tr} (A^{2})(\operatorname {tr} A)+2\operatorname {tr} (A^{3}){\bigr )}A+\det(A)I_{4}=O}
と書けるし、この場合の行列式
1
24
(
(
tr
A
)
4
−
6
tr
(
A
2
)
(
tr
A
)
2
+
3
(
tr
(
A
2
)
)
2
+
8
tr
(
A
3
)
tr
(
A
)
−
6
tr
(
A
4
)
)
{\displaystyle {\tfrac {1}{24}}((\operatorname {tr} A)^{4}-6\operatorname {tr} (A^{2})(\operatorname {tr} A)^{2}+3(\operatorname {tr} (A^{2}))^{2}+8\operatorname {tr} (A^{3})\operatorname {tr} (A)-6\operatorname {tr} (A^{4}))}
は c n − 4 を表す式に他ならない。以下より大きな次数の行列に対しても帰納的に同様の話を適用することができる。
係数 ck に対するもっと複雑な表示が、ニュートンの公式 (英語版 ) やファデーエフ–ルヴェリエのアルゴリズム (英語版 ) などから導ける。係数 ck を求める別の方法として、一般の n 次正方行列でどの根も 0 でないものと仮定すれば、指数函数を用いた行列式の別表示
p
(
λ
)
=
det
(
λ
I
n
−
A
)
=
λ
n
exp
(
tr
(
log
(
I
n
−
A
/
λ
)
)
)
{\displaystyle p(\lambda )=\det(\lambda I_{n}-A)=\lambda ^{n}\exp(\operatorname {tr} (\log(I_{n}-A/\lambda )))}
を用いたアルゴリズムがある。メルカトル級数 を用いて書けば
p
(
λ
)
=
λ
n
exp
(
−
tr
∑
m
=
1
∞
(
A
λ
)
m
m
)
{\displaystyle p(\lambda )=\lambda ^{n}\exp \!{\bigg (}-\operatorname {tr} \textstyle \sum \limits _{m=1}^{\infty }{\dfrac {({\frac {A}{\lambda }})^{m}}{m}}{\biggr )}}
であるが、p (λ ) は n 次だから、この指数函数部分は λ − n のオーダーまで展開するだけでよい。λ の最後の負冪はケイリー・ハミルトンの定理により自動的に消える(再度、これには係数環が有理数体を含むことが必要である)。λ に対する係数たちが完全ベル多項式によって直接的に書けることは、この級数表示とベル多項式の母函数を比べれば分かる。この表示を λ に関して微分することで、一般の n に対する固有多項式の一般係数を m 次行列式
c
n
−
m
=
(
−
1
)
m
m
!
|
tr
A
m
−
1
0
⋯
tr
A
2
tr
A
m
−
2
⋯
⋮
⋮
⋮
tr
A
m
−
1
tr
A
m
−
2
⋯
⋯
1
tr
A
m
tr
A
m
−
1
⋯
⋯
tr
A
|
{\displaystyle c_{n-m}={\frac {(-1)^{m}}{m!}}{\begin{vmatrix}\operatorname {tr} A&m-1&0&\cdots \\\operatorname {tr} A^{2}&\operatorname {tr} A&m-2&\cdots \\\vdots &\vdots &&&\vdots \\\operatorname {tr} A^{m-1}&\operatorname {tr} A^{m-2}&\cdots &\cdots &1\\\operatorname {tr} A^{m}&\operatorname {tr} A^{m-1}&\cdots &\cdots &\operatorname {tr} A\end{vmatrix}}}
として求めることができる[注 4] 。
高次の冪の計算
ケイリー・ハミルトンの定理は A の冪の間に成り立つ(最も
とは限らないが)関係を記述するものであるから、それにより A の十分大きな指数の冪を含む式の計算において、式を簡単化して A の(n 以上の指数が大きな)冪を直接計算することなく値を評価することができるようになる。
例えば二次の場合に、
A
=
(
a
b
c
d
)
{\displaystyle A={\begin{pmatrix}a&b\\c&d\end{pmatrix}}}
とすれば定理より
A
2
=
tr
(
A
)
A
−
det
(
A
)
I
2
{\displaystyle A^{2}=\color {red}\operatorname {tr} (A)A-\det(A)I_{2}}
だから、A 4 を計算したければ、順に
A
3
=
(
tr
(
A
)
A
−
det
(
A
)
I
2
)
A
=
tr
(
A
)
(
tr
(
A
)
A
−
det
(
A
)
I
2
)
−
det
(
A
)
A
=
(
tr
(
A
)
2
−
det
(
A
)
)
A
−
tr
(
A
)
det
(
A
)
I
2
A
4
=
(
(
tr
(
A
)
2
−
det
(
A
)
)
A
−
tr
(
A
)
det
(
A
)
I
2
)
A
=
(
tr
(
A
)
2
−
det
(
A
)
)
(
tr
(
A
)
A
−
det
(
A
)
I
2
)
−
tr
(
A
)
det
(
A
)
A
=
(
tr
(
A
)
3
−
2
tr
(
A
)
det
(
A
)
)
A
−
(
tr
(
A
)
2
det
(
A
)
−
det
(
A
)
2
)
I
2
{\displaystyle {\begin{aligned}A^{3}&=(\operatorname {tr} (A)A-\det(A)I_{2})A=\operatorname {tr} (A)(\color {red}\operatorname {tr} (A)A-\det(A)I_{2}\color {black})-\det(A)A=\color {green}{(\operatorname {tr} (A)^{2}-\det(A))A-\operatorname {tr} (A)\det(A)I_{2}}\\[5pt]A^{4}&=(\color {green}(\operatorname {tr} (A)^{2}-\det(A))A-\operatorname {tr} (A)\det(A)I_{2}\color {black})A=(\operatorname {tr} (A)^{2}-\det(A))(\color {red}\operatorname {tr} (A)A-\det(A)I_{2}\color {black})-\operatorname {tr} (A)\det(A)A\\&=(\operatorname {tr} (A)^{3}-2\operatorname {tr} (A)\det(A))A-(\operatorname {tr} (A)^{2}\det(A)-\det(A)^{2})I_{2}\end{aligned}}}
のように次数の低い多項式表示に帰着される。同様に
A
−
1
=
−
A
−
tr
(
A
)
I
2
det
(
A
)
.
{\displaystyle A^{-1}=-{\frac {A-\operatorname {tr} (A)I_{2}}{\det(A)}}.}
二次の場合には二つの項の和で書けるということが上での計算から分かる。事実として、任意の k -乗がその正方行列の次数 n に対して次数高々 n − 1 の多項式として書き表せる。これは定理を行列函数の表示に利用できることの一つの実例であり、次の節でより系統的に述べる。
行列函数を多項式に帰着する
解析函数が収束冪級数として
f
(
x
)
=
∑
k
=
0
∞
a
k
x
k
{\displaystyle f(x)=\textstyle \sum \limits _{k=0}^{\infty }a_{k}x^{k}}
と与えられ、n 次正方行列 A の固有多項式を p (x ) と書くとき、上記の冪級数を十分大きな k で打ち切った多項式に対する剰余付きの除法 を考えれば、
f
(
x
)
=
q
(
x
)
p
(
x
)
+
r
(
x
)
{\displaystyle f(x)=q(x)p(x)+r(x)}
で「剰余」多項式 r (x ) が 0 ≤ deg r (x ) < n となる「商」解析函数 q (x ) とともに一意的に決まる。x を行列 A に置き換えれば、ケイリー・ハミルトンの定理により p (A ) = O だから、ある種の剰余の定理 :
f
(
A
)
=
r
(
A
)
{\displaystyle f(A)=r(A)}
が成り立つ。ゆえに、行列変数の解析函数は各行列 A ごとに n 次以下の行列多項式として書き表される。
上記除算の剰余を
r
(
x
)
:=
c
0
+
c
1
x
+
⋯
+
c
n
−
1
x
n
−
1
{\displaystyle r(x):=c_{0}+c_{1}x+\cdots +c_{n-1}x^{n-1}}
と書けば、A の固有値 λ において評価するとき p (λ ) = 0 となるから、各固有値に関して等式
f
(
λ
i
)
=
r
(
λ
i
)
=
c
0
+
c
1
λ
i
+
⋯
+
c
n
−
1
λ
i
n
−
1
(
∀
i
=
1
,
2
,
⋯
,
n
)
{\displaystyle f(\lambda _{i})=r(\lambda _{i})=c_{0}+c_{1}\lambda _{i}+\cdots +c_{n-1}\lambda _{i}^{n-1}\qquad (\forall i=1,2,\cdots ,n)}
を作ることができる。これは n 個の線型方程式系になっているから、解くことで係数 ci を決定することができて、
f
(
A
)
=
∑
k
=
0
n
−
1
c
k
A
k
{\displaystyle f(A)=\textstyle \sum \limits _{k=0}^{n-1}c_{k}A^{k}}
が決まる。
固有値が重複を持つ場合、つまり適当な i ≠ j に対して λi = λj となるものが存在するとき、上記の方程式系は少なくとも2つの方程式が一致してしまうから、それにより方程式系を一意に解くことができない。そのような場合には、固有値 λ の重複度が m とすれば、p (x ) の m − 1 階までの導函数がその固有値において消えるから、線型独立な方程式
d
k
f
(
x
)
d
x
k
|
x
=
λ
=
d
k
r
(
x
)
d
x
k
|
x
=
λ
(
∀
k
=
1
,
2
,
⋯
,
m
−
1
)
{\displaystyle {\frac {d^{k}f(x)}{{\mathit {dx}}^{k}}}{\Big |}_{x=\lambda }={\frac {d^{k}r(x)}{{\mathit {dx}}^{k}}}{\Big |}_{x=\lambda }\qquad (\forall k=1,2,\cdots ,m-1)}
を新たに m − 1 本追加して、係数 ci を決めるのに必要な n 個の方程式系を得ることができる。
全ての点 (λi , f (λi )) を通る多項式を求めることは本質的に補間問題 であり、ラグランジュ補間 やニュートン補間 法を用いて解くことができ、シルベスターの公式 (英語版 ) が導かれる。
例1
例として、
f
(
A
)
=
e
A
t
(
A
=
(
1
2
0
3
)
)
{\displaystyle f(A)=e^{At}\qquad (A={\begin{pmatrix}1&2\\0&3\end{pmatrix}})}
の多項式表現を求めよう。A の固有多項式は p (x ) = x 2 − 4x + 3 , 固有値は λ = 1, 3 である。剰余を r (x ) = c 0 + c 1 x と置き、固有値における値 f (λ ) = r (λ ) を評価して、線型方程式系
et = c 0 + c 1 ,
e 3t = c 0 + 3c 1
を得る。これを解けば
c 0 = (3et − e 3t )/2, c 1 = (e 3t − et )/2
を得るから、
e
A
t
=
c
0
I
2
+
c
1
A
=
(
e
t
e
3
t
−
e
t
0
e
3
t
)
{\displaystyle e^{At}=c_{0}I_{2}+c_{1}A={\begin{pmatrix}e^{t}&e^{3t}-e^{t}\\0&e^{3t}\end{pmatrix}}}
となる。函数を g (A ) = sin(At ) に変えれば、係数は c 0 = (3sin(t ) − sin(3t ))/2 および c 1 = (sin(3t ) − sin(t ))/2 となるから
sin
(
A
t
)
=
(
sin
t
sin
3
t
−
sin
t
0
sin
3
t
)
{\displaystyle \sin(At)={\begin{pmatrix}\sin t&\sin 3t-\sin t\\0&\sin 3t\end{pmatrix}}}
と求まる。
例2
同様にして、
f
(
A
)
=
e
A
t
(
A
=
(
0
1
−
1
0
)
)
{\displaystyle f(A)=e^{At}\qquad (A={\begin{pmatrix}0&1\\-1&0\end{pmatrix}})}
を考える。A の固有多項式は p (x ) = x 2 + 1 , 固有値は λ = ±i である。先と同様に、固有値における値に関する連立方程式
eit = c 0 + ic 1 ,
e−it = c 0 − ic 1
を解いて、
c 0 = (eit + e−it )/2 = cos(t ), c 1 = (eit − e− it )/2i = sin(t )
を得る。この場合の
e
A
t
=
(
cos
t
)
I
2
+
(
sin
t
)
A
=
(
cos
t
sin
t
−
sin
t
cos
t
)
{\displaystyle e^{At}=(\cos t)I_{2}+(\sin t)A={\begin{pmatrix}\cos t&\sin t\\-\sin t&\cos t\end{pmatrix}}}
は回転行列 である。
このような利用法の標準的な例は、行列リー群 (英語版 ) への付随するリー環 からの指数写像 である。これは行列指数関数
exp
:
g
→
G
;
{\displaystyle \exp \colon {\mathfrak {g}}\to G;}
t
X
↦
e
t
X
=
∑
n
=
0
∞
t
n
X
n
n
!
=
I
+
t
X
+
t
2
X
2
2
+
⋯
(
t
∈
R
,
X
∈
g
)
{\displaystyle tX\mapsto e^{tX}=\textstyle \sum \limits _{n=0}^{\infty }{\dfrac {t^{n}X^{n}}{n!}}=I+tX+{\dfrac {t^{2}X^{2}}{2}}+\cdots \qquad (t\in \mathbb {R} ,X\in {\mathfrak {g}})}
として与えられる。その多項式表示は SU(2) に対しては古くから知られており、パウリ行列 σ を用いて
e
i
(
θ
/
2
)
(
n
^
⋅
σ
)
=
I
2
cos
θ
/
2
+
i
(
n
^
⋅
σ
)
sin
θ
/
2
{\displaystyle e^{i(\theta /2)({\hat {n}}\cdot \sigma )}=I_{2}\cos \theta /2+i({\hat {n}}\cdot \sigma )\sin \theta /2}
と書ける。SO(3) も同様で
e
i
θ
(
n
^
⋅
J
)
=
I
3
+
i
(
n
^
⋅
J
)
sin
θ
+
(
n
^
⋅
J
)
2
(
cos
θ
−
1
)
{\displaystyle e^{i\theta ({\hat {n}}\cdot \mathbf {J} )}=I_{3}+i({\hat {n}}\cdot \mathbf {J} )\sin \theta +({\hat {n}}\cdot \mathbf {J} )^{2}(\cos \theta -1)}
と書ける(これはロドリゲスの回転公式 である)。記法については (rotation group SO(3)#A note on Lie algebra ) を見よ。
後に下れば、ほかの群に対する表示も知られており、例えばローレンツ群 SO(3, 1) , O(4, 2) , SU(2, 2) , GL(n , R ) など。ここに O(4, 2) は時空 の共形群 (英語版 ) で SU(2, 2) はその単連結 被覆(より精確には、O(4, 2) の連結成分 SO+ (4, 2) の単連結被覆)である。得られた多項式表示は、これら群の標準表現 (standard representation) に適用される。行列の冪を計算するために固有値に関するある種の知識が必要である。SU(2) の(したがって SO(3) ) の)閉じた式は、近年にはすべての既約表現(例えば任意の spin )に対して得られている。
フェルディナント・ゲオルク・フロベニウス (1849-1917) はドイツの数学者。主な興味は楕円函数 、微分方程式 、のちに群論 。 1878年、フロベニウスがケイリー・ハミルトンの定理の完全な証明を初めて与えた。
代数的数論
代数的整数の最小多項式 の計算においてもケイリー・ハミルトンの定理は有用である。例えば、Q の有限次拡大 Q [α 1 , …, αk ] とその代数的整数 α (これは添加された元の冪積 α n 1 1 …α nk k の非自明な Q -線型結合に書ける)が与えられたとき、α を掛けるという Q -線型変換
⋅
α
:
Q
[
α
1
,
⋯
,
α
k
]
→
Q
[
α
1
,
⋯
,
α
k
]
{\displaystyle \cdot \alpha \colon \mathbb {Q} [\alpha _{1},\cdots ,\alpha _{k}]\to \mathbb {Q} [\alpha _{1},\cdots ,\alpha _{k}]}
の表現行列を A と書けば、A にケイリー・ハミルトンの定理を適用することにより α の最小多項式が求まる[22] 。
一般次数の n 次正方行列
A
=
(
a
i
j
)
i
,
j
=
1
n
{\displaystyle A=(a_{ij})_{i,j=1}^{n}}
についてのケイリー・ハミルトンの定理の証明には、いくつかの方法がある。
三角化による証明
文献[23] に掲載されている方法による。
A の固有多項式を
p
A
(
t
)
=
det
(
t
I
n
−
A
)
{\displaystyle p_{A}(t)=\det(tI_{n}-A)}
, 固有値を λ 1 , …, λn とする。
p
A
(
t
)
=
(
t
−
λ
1
)
⋯
(
t
−
λ
n
)
{\displaystyle p_{A}(t)=(t-\lambda _{1})\cdots (t-\lambda _{n})}
A を上三角化した行列を B とする。このとき対角成分に固有値 λ 1 , …, λn が並ぶ:
B
:=
P
−
1
A
P
=
(
λ
1
∗
λ
2
λ
3
⋱
λ
n
)
{\displaystyle B:=P^{-1}AP={\begin{pmatrix}\lambda _{1}&&&*&\\&\lambda _{2}&&&\\&&\lambda _{3}&&\\&&&\ddots &\\&&&&\lambda _{n}\end{pmatrix}}}
p
A
(
A
)
=
(
A
−
λ
1
I
)
⋯
(
A
−
λ
n
I
)
=
(
P
B
P
−
1
−
λ
1
I
)
⋯
(
P
B
P
−
1
−
λ
n
I
)
=
P
{
(
B
−
λ
1
I
)
⋯
(
B
−
λ
n
I
)
}
P
−
1
⋯
(
1
)
{\displaystyle {\begin{aligned}p_{A}(A)&=(A-\lambda _{1}I)\cdots (A-\lambda _{n}I)\\&=(PBP^{-1}-\lambda _{1}I)\cdots (PBP^{-1}-\lambda _{n}I)\\&=P\{(B-\lambda _{1}I)\cdots (B-\lambda _{n}I)\}P^{-1}\ \cdots \ (1)\\\end{aligned}}}
ここで
p
B
(
B
)
=
(
B
−
λ
1
I
)
⋯
(
B
−
λ
n
I
)
{\displaystyle p_{B}(B)=(B-\lambda _{1}I)\cdots (B-\lambda _{n}I)}
を計算する。
C
k
:=
B
−
λ
k
I
(
k
=
1
,
2
,
⋯
,
n
)
{\displaystyle C_{k}:=B-\lambda _{k}I\ (k=1,2,\cdots ,n)}
とおく。Ck は上三角行列で、(k , k ) 成分は 0 である。
C
1
C
2
{\displaystyle C_{1}C_{2}}
を計算すると、
(
0
∗
⋯
∗
∗
⋯
∗
⋱
⋮
∗
)
(
∗
∗
⋯
∗
0
⋯
∗
⋱
⋮
∗
)
=
(
0
0
⋯
∗
0
⋯
∗
⋱
⋮
∗
)
{\displaystyle \left({\begin{array}{c|c|cc}0&*&\cdots &*\\\hline &*&\cdots &*\\\hline &&\ddots &\vdots \\&&&*\end{array}}\right)\left({\begin{array}{c|c|cc}*&*&\cdots &*\\\hline &0&\cdots &*\\\hline &&\ddots &\vdots \\&&&*\end{array}}\right)=\left({\begin{array}{c|c|cc}0&0&\cdots &*\\\hline &0&\cdots &*\\\hline &&\ddots &\vdots \\&&&*\end{array}}\right)}
故に、第2列までは成分が全て 0 になる。同様にして、帰納的に、
C
k
{\displaystyle C_{k}}
を掛けると、第k 列までの成分は全て 0 になる。これを n 番目まで繰り返すことにより
C
1
⋯
C
n
=
O
{\displaystyle C_{1}\cdots C_{n}=O}
故に (1) は
P
(
C
1
⋯
C
n
)
P
−
1
=
O
{\displaystyle P(C_{1}\cdots C_{n})P^{-1}=O}
(証明終)
単因子による証明
単因子 論を用いると、簡単に導出できる。ただし、単因子標準形の存在・一意性の証明にはかなりの工程を要する[24] 。
文献[24] に掲載されている方法による。
xI − A の単因子標準形は、
deg
det
(
x
I
−
A
)
=
n
{\displaystyle \deg \det(xI-A)=n}
より、
P
(
x
)
(
x
I
−
A
)
Q
(
x
)
=
(
e
1
(
x
)
⋱
e
n
(
x
)
)
{\displaystyle P(x)(xI-A)Q(x)={\begin{pmatrix}e_{1}(x)&&\\&\ddots &\\&&e_{n}(x)\\\end{pmatrix}}}
の形となる。ここで、ek (x ) はモニック多項式 、e k − 1 (x ) | ek (x ) (つまり ek (x ) は e k − 1 (x ) で割り切れる)である。
単因子論で知られている結果として、最後の単因子 en (x ) は A の最小多項式 φA (x ) に等しい。
p
A
(
x
)
=
det
(
x
I
−
A
)
=
det
P
(
x
)
−
1
⋅
(
e
1
(
x
)
⋯
e
n
−
1
(
x
)
ϕ
A
(
x
)
)
⋅
det
Q
(
x
)
−
1
{\displaystyle {\begin{aligned}p_{A}(x)&=\det(xI-A)\\&=\det P(x)^{-1}\cdot (e_{1}(x)\cdots e_{n-1}(x)\phi _{A}(x))\cdot \det Q(x)^{-1}\end{aligned}}}
故に固有多項式 pA (x ) は最小多項式 φA (x ) で割り切れると分かる。故に p (A ) = O (証明終)
余因子行列による証明
A の固有多項式を定義する行列 tIn − A は多項式行列 である。多項式全体は可換環をなすから、この行列の余因子行列
B
(
t
)
:=
adj
(
t
I
n
−
A
)
{\displaystyle B(t):=\operatorname {adj} (tI_{n}-A)}
が存在して、基本関係式により
(
t
I
n
−
A
)
B
(
t
)
=
det
(
t
I
n
−
A
)
I
n
=
p
(
t
)
I
n
{\displaystyle (tI_{n}-A)B(t)=\det(tI_{n}-A)I_{n}=p(t)I_{n}}
(1 )
が成り立つ。
この B (t ) もまた t を変数とする多項式行列であるから、各 i に対して行列の各成分から ti の項だけを取り出してまとめたものを係数行列 Bi として、
B
(
t
)
=
∑
i
=
0
n
−
1
t
i
B
i
{\displaystyle B(t)=\textstyle \sum \limits _{i=0}^{n-1}t^{i}B_{i}}
(B )
と書き直すことができる(B (t ) の定義の仕方から、t n − 1 より高次の冪は現れないことに注意)。これは、多項式行列を、「行列を係数とする多項式」(定数成分行列の線型結合)で表す便法である(それを強調するために ti は係数として左側に書いている)。
さて等式 1 を積の双線型性により展開すれば
p
(
t
)
I
n
=
t
B
(
t
)
−
A
B
(
t
)
=
∑
i
=
0
n
−
1
t
i
+
1
B
i
−
∑
i
=
0
n
−
1
t
i
A
B
i
=
t
n
B
n
−
1
+
∑
i
=
1
n
−
1
t
i
(
B
i
−
1
−
A
B
i
)
−
A
B
0
=:
t
n
I
n
+
t
n
−
1
c
n
−
1
I
n
+
⋯
+
t
c
1
I
n
+
c
0
I
n
{\displaystyle {\begin{aligned}p(t)I_{n}&=tB(t)-AB(t)\\&=\textstyle \sum \limits _{i=0}^{n-1}t^{i+1}B_{i}-\sum \limits _{i=0}^{n-1}t^{i}AB_{i}\\&=t^{n}B_{n-1}+\textstyle \sum \limits _{i=1}^{n-1}t^{i}(B_{i-1}-AB_{i})-AB_{0}\\&=:t^{n}I_{n}+t^{n-1}c_{n-1}I_{n}+\cdots +tc_{1}I_{n}+c_{0}I_{n}\end{aligned}}}
の形に書ける(これは t を変数とする2つの多項式行列の間の等式である)。この等式が成り立つのは、各 i について、ti を係数とする定数成分行列がそれぞれ等しくなるときである。このような係数比較 (英語版 ) により、
B
n
−
1
=
I
n
,
B
i
−
1
−
A
B
i
=
c
i
I
n
(
i
=
1
,
⋯
,
n
−
1
)
,
−
A
B
0
=
c
0
I
n
{\displaystyle {\begin{aligned}&B_{n-1}=I_{n},\\&B_{i-1}-AB_{i}=c_{i}I_{n}\qquad (i=1,\cdots ,n-1),\\&-AB_{0}=c_{0}I_{n}\end{aligned}}}
を得る。これにそれぞれ(比較に用いた ti に応じて)Ai を掛けて足し合わせた
p
(
A
)
=
A
n
+
c
n
−
1
A
n
−
1
+
⋯
+
c
1
A
+
c
0
I
n
=
A
n
B
n
−
1
+
∑
i
=
1
n
−
1
(
A
i
B
i
−
1
−
A
i
+
1
B
i
)
−
A
B
0
{\displaystyle {\begin{aligned}p(A)&=A^{n}+c_{n-1}A^{n-1}+\cdots +c_{1}A+c_{0}I_{n}\\&=A^{n}B_{n-1}+\textstyle \sum \limits _{i=1}^{n-1}\left(A^{i}B_{i-1}-A^{i+1}B_{i}\right)-AB_{0}\end{aligned}}}
は畳み込み和 として全ての項が打ち消し合うから、p (A ) = O となる。(証明終)
行列係数の多項式を用いた証明
まず、前節の証明に現れる式によって示唆される「行列係数の多項式」という概念について正当化しておく。これには非可換環係数の多項式というある意味普通ではないものを考えることになるので、入念に注意を払う必要が出てくる。通常の多項式で正当化されることが、今の定では適用できないということが多々起こる[注 5] 。
著しい点として、通常の可換環係数の多項式に対する算術は、多項式を多項式函数 と同一視して函数としての(点ごと の)演算を雛形とすることができるが、非可換環係数ではそれは可能ではない(実は、非可換環上での場合には、乗法のもとで閉じる 多項式函数の明らかな概念は存在しない)。それゆえ、行列係数の変数 t に関する多項式を考えるときには、変数 t は係数環の任意の値を取りうる「未知数 」と考えてはいけなくて、いくつかの決まったルールに従う形式的な記号としての「不定元 」として扱うべきである。特に t に特定の値を代入しようというのは危険である[注 5] 。
(
f
+
g
)
(
x
)
=
∑
i
(
f
i
+
g
i
)
x
i
=
∑
i
f
i
x
i
+
∑
i
g
i
x
i
=
f
(
x
)
+
g
(
x
)
{\displaystyle (f+g)(x)=\sum _{i}\left(f_{i}+g_{i}\right)x^{i}=\sum _{i}f_{i}x^{i}+\sum _{i}g_{i}x^{i}=f(x)+g(x)}
適当な環 R (例えば実数体 R や複素数体 C )に成分を持つ n 次正方行列環 を M (n , R ) と書き、その一つの元として行列 A をとる。t に関する多項式を係数として持つ行列、例えば tIn − A やその余因子行列(の転置行列)B なとは M (n , R [t ]) の元である。t の同じ次数の冪を含む項をまとめることにより、M (n , R [t ]) に属する行列を t を変数とする行列係数の「多項式」の形に書き表すことができる。行列係数の多項式全体の成す集合を M (n , R )[t ] と書けば、M (n , R )[t ] と M (n , R [t ]) との間に一対一対応 が存在するから、それにより対応する算術演算を定義することができる。特に乗法は
(
∑
M
i
t
i
)
(
∑
N
j
t
j
)
=
∑
i
,
j
(
M
i
N
j
)
t
i
+
j
{\displaystyle \left(\sum M_{i}t^{i}\right)\left(\sum N_{j}t^{j}\right)=\sum _{i,j}(M_{i}N_{j})t^{i+j}}
で与えられる。これは明らかに非可換な乗法である(特に右辺の係数における積の順番は、左辺の対応する因子の現れる順番を反映するようにしなければならない)[注 5] 。
この設定で、等式
(
t
I
n
−
A
)
B
=
p
(
t
)
I
n
{\displaystyle (tI_{n}-A)B=p(t)I_{n}}
は M (n , R )[t ] の元の間の乗法を含む式と見なすことができる。この時点で、単に t が行列 A に等しいとおく誘惑にかられそうになる(そうすれば左辺は零行列で右辺は p (A ) になるから)が、これは係数が可換でないときには許されない操作である[注 5] 。それでも非可換環 M 上で「右評価写像」evA : M [t ] → M は定義できる(これは各 ti を A の冪 Ai で置き換えるが、この冪は常に対応する係数の右から掛けるものと約束するものである)。ただしこれは環準同型にならない(積の右評価写像の値は右評価写像の積とは一般には異なる)から、行列係数多項式の乗法が t を係数環に属する未知数と見ての乗法を雛形としたものでないことが確認できる(積 Mti ⋅ Ntj = (MN )ti+j は変数 t は常に N と可換と仮定することで定義できるが、これは t を行列 A で置き換えるときには常には期待できない。ただし、手近な特定の状況を想定する場合にはこの問題をうまく回避できることもある(たとえば、上記の右評価写像は行列 A が係数環の中心 に属している場合には(どの多項式でもすべての係数と A は可換になるから)環準同型になる)。
ケイリー・ハミルトンの定理の証明では M を行列環全体と考えるならば A は必ずしも中心に属するわけではないけれども、M としてより小さい環(証明に現れるすべての多項式の係数すべてを含んでいるようなもの)に取り換えて、その中の元すべてが A と可換になるようにするという手段をとることはできる。明らかに、A と可換な行列全体として与えられる部分環(すなわち A の中心化環)Z はそのような部分環の候補になる(定義により、A は Z の中心元である)。この中心化環が In および A を含んでいることは明らかだが、tIn − A の余因子行列の転置 (adjugate matrix) B に現れる ti の係数 Bi を含むことも示せる。実際、余因子行列の転置の基本関係として
B
(
t
I
n
−
A
)
=
(
t
I
n
−
A
)
B
{\displaystyle B(tI_{n}-A)=(tI_{n}-A)B}
が成り立つが、これに B = ∑ m i = 0 Bi ⋅ ti を代入して整理すれば
∑
i
=
0
m
B
i
A
t
i
=
∑
i
=
0
m
A
B
i
t
i
{\displaystyle \sum _{i=0}^{m}B_{i}At^{i}=\sum _{i=0}^{m}AB_{i}t^{i}}
が残る。各 i に対して係数比較 (英語版 ) を行うことにより、所期の式 ABi = Bi A が得られる。
このように実際に evA が環準同型となる適切な設定の下が求められたからには、定理の証明は
ev
A
(
p
(
t
)
I
n
)
=
ev
A
(
(
t
I
n
−
A
)
B
)
p
(
A
)
=
ev
A
(
t
I
n
−
A
)
⋅
ev
A
(
B
)
p
(
A
)
=
(
A
I
n
−
A
)
⋅
ev
A
(
B
)
=
O
⋅
ev
A
(
B
)
=
O
{\displaystyle {\begin{aligned}\operatorname {ev} _{A}{\bigl (}p(t)I_{n}{\bigr )}&=\operatorname {ev} _{A}((tI_{n}-A)B)\\p(A)&=\operatorname {ev} _{A}(tI_{n}-A)\cdot \operatorname {ev} _{A}(B)\\p(A)&=(AI_{n}-A)\cdot \operatorname {ev} _{A}(B)=O\cdot \operatorname {ev} _{A}(B)=O\end{aligned}}}
として完成する。
2つの証明の折衷
余因子行列の証明において、B の係数 Bi は随伴行列の基本関係式の右辺だけに基づいて決定することができる。実は導かれた最初の n 本の式は、多項式 p (t )In をモニック多項式 In t − A で除した 商 B を決定するものと解釈することができ、また最後の式はその除した剰余が零であるという事実を表すと解釈できる。この割り算は行列係数多項式の環において行われる。実際、非可換環係数の場合においてさえも、モニック多項式 P によるユークリッド除法(余り付き除算)は定義され、通常(可換環上)と同様に次数に関する条件を満たす商と剰余が常に一意的に取り出される(ここで P がどちら側因子であるかは決まっていることが前提である。今の場合は左因子である)。
注 ここでの主張において重要な点である「商と剰余が一意であること」を見るには、2通りの表示 PQ + r = PQ′ + r′ があったとしてそれを P (Q − Q′ ) = r′ − r の形に書けば十分である。実際、P はモニック(最高次係数 1)であるから P (Q − Q′ ) の次数は Q = Q′ でなければ P の次数より小さくはならない。
しかしここで用いた被除数 p (t )In も除数 In t − A もともに部分環 (R [A ])[t ] に属している(ここで R [A ] は A の生成する行列環 M (n , R ) の部分環、すなわち A のすべての冪によって R 上線型に張られる集合 である)。したがって、実は上記の割り算は可換多項式環の中で実行できるものであり、もちろんこの小さい環においても同じ商 B と剰余 0 が与えられる。このことから特に B が実は (R [A ])[t ] に属すことが分かる。このように可換環部分環の中で考えれば、等式 p (t )In = (tIn − A )B において t を A とおくことは有効、すなわち評価写像
ev
A
:
(
R
[
A
]
)
[
t
]
→
R
[
A
]
{\displaystyle \operatorname {ev} _{A}\colon (R[A])[t]\to R[A]}
は環準同型となり第二の証明と同じく所期の
p
(
A
)
=
0
⋅
ev
A
(
B
)
=
0
{\displaystyle p(A)=0\cdot \operatorname {ev} _{A}(B)=0}
を与える。
定理を証明することに加えて、上記の論法では B の係数 Bi は A に関する多項式であることまで分かる(これに対して、第二の証明からはそれらは A の中心化環 Z に入ることしか分からない。一般に Z は R [A ] より大きな部分環であり、可換とも限らない)。特に定数項 B 0 = adj(− A ) が R [A ] に入る。A は勝手な正方行列でよかったのだから、これにより adj(A ) が常に A の多項式に書ける(係数は A ごとに変わる)ことが保証される。
実は最初の証明で求めた等式により順番に
B
n
−
1
,
⋯
,
B
1
,
B
0
{\displaystyle B_{n-1},\cdots ,B_{1},B_{0}}
を A の多項式として表すことができ、任意の n 次正方行列に対して有効な恒等式
adj
(
−
A
)
=
∑
i
=
1
n
c
i
A
i
−
1
{\displaystyle \operatorname {adj} (-A)=\sum _{i=1}^{n}c_{i}A^{i-1}}
が導かれる。ここに、ci は A の固有多項式 p (t ) = tn + c n − 1t n − 1 + … + c 1 t + c 0 のものである。
注 この恒等式はケイリー・ハミルトンの定理の主張を含意するものである。実際、adj(−A ) を右辺に移項してから A を(左から、あるいは右から)掛け、基本関係式 (adj ) から分かる:
−
A
⋅
adj
(
−
A
)
=
adj
(
−
A
)
⋅
(
−
A
)
=
det
(
−
A
)
I
n
=
c
0
I
n
{\displaystyle -A\cdot \operatorname {adj} (-A)=\operatorname {adj} (-A)\cdot (-A)=\det(-A)I_{n}=c_{0}I_{n}}
を入れれば所期の式である。
→「
ファデーエフ-ルヴェリエのアルゴリズム (英語版 ) 」も参照
上で述べた通り、定理の主張における行列 p (A ) は、先に行列式を評価してからその後で行列 A を変数 t に代入して得るものであり、行列式を計算する前に行列 tIn − A に代入を行うことは意味をなさない。にも拘らず、p (A ) をある特定の行列式の値として直截に得ることのできる解釈を与えることは可能である。
ただしこれには、環上の行列 A とはその成分 aij のことともそれらの全体としての A そのものとも解釈できるというような、やや面倒な状況を設定する必要がある。すなわち、環 R 上の n 次正方行列全体の成す環 M (n , R ) の中で、成分 aij はスカラー行列 aij In として実現されるし、A それ自体も入っている。しかし行列を成分とする行列は、ここでの意図でない区分行列 との混同を引き起こしかねない(区分行列と考えると行列式の概念が正しく与えられない[注 6] )。状況をよりはっきりさせるため、基底 e 1 , …, en を持つ n 次元ベクトル空間(係数環 R が体でないときは n 階 R -自由加群)V 上の自己準同型 φ を行列 A と区別をつけて、全自己準同型環 V 上の行列を考えることにする。そうすると、各 φ ∈ End(V ) は行列の成分になれるし、その一方で行列 A とは各 (i , j ) 成分がスカラー aij 倍するという自己準同型になっているような M (n , End(V )) の元を指すものとできる(同様に単位行列 In も M (n , End(V )) の元と解釈される)。
ただし、End(V ) は可換環ではないから、M (n , End(V )) の全体で定義される行列式は存在せず、End(V ) の可換部分環上の行列に限った場合にだけ行列式が定義できることには注意しなければならない。今、問題の行列 φIn − A の成分はすべて、φ と恒等変換で R 上生成される可換部分環 R [φ ] に属しているから、行列式をとる写像 det: M (n , R [φ ]) → R [φ ] は定義されて、det(φIn − A ) を A の固有多項式を φ において評価した値とすることができる(このことは A と φ との間に成り立つ関係とは無関係に成り立つ)。
この設定で、ケイリー・ハミルトンの定理の主張は p (φ ) が零写像 となることである。この設定での定理の証明を以下に示す(これは(中山の補題 と関連した)より一般の形で (Atiyah & MacDonald 1969 , Prop. 2.4) にあるものである):
自己準同型環上の行列に基づく証明
行列 A = (aij ) が基底 e 1 , …, en に関する φ の表現行列であるとは
φ
(
e
i
)
=
∑
j
=
1
n
a
j
,
i
e
j
(
i
=
1
,
⋯
,
n
)
{\displaystyle \varphi (e_{i})=\sum _{j=1}^{n}a_{j,i}e_{j}\quad (i=1,\cdots ,n)}
と書けることであった。これらを行列のベクトルへの左乗 M (n , End(V )) × Vn → Vn の形に書いて Vn における一つの等式の n 個の成分と解釈することができる(行列のベクトルへの積は、個々の成分が ψ ∈ End(V ) および v ∈ V の間では ψ (v ) という形で「掛け合わされる」ということを除けば通常通りに定義できる)。そうして、上記は一つの等式
φ
I
n
⋅
E
=
A
tr
⋅
E
{\displaystyle \varphi I_{n}\cdot E=A^{\operatorname {tr} }\cdot E}
の形にまとめられる。ここに、E ∈ Vn は第i 成分が ei となる元(というより、V の基底ベクトル e 1 , …, en をこの順で列ベクトルにもつ行列)で、右肩の tr は行列の転置 。整理すれば
(
φ
I
n
−
A
tr
)
⋅
E
=
0
∈
V
n
{\displaystyle (\varphi I_{n}-A^{\operatorname {tr} })\cdot E=0\in V^{n}}
の形に書ける。左辺に現れた行列は φIn − A の転置と理解すれば、この行列の(M (n , R [φ ]) の元としての)行列式もまた p (φ ) に等しい。さてこの等式から p (φ ) = 0 ∈ End(V ) を導くためには、φIn − A tr の(行列環 M (n , R [φ ]) における)余因子行列 の転置 (adjugate matrix ) を左から掛ければよい。これは
0
=
adj
(
φ
I
n
−
A
tr
)
⋅
(
(
φ
I
n
−
A
tr
)
⋅
E
)
=
(
adj
(
φ
I
n
−
A
tr
)
⋅
(
φ
I
n
−
A
tr
)
)
⋅
E
=
(
det
(
φ
I
n
−
A
tr
)
I
n
)
⋅
E
=
(
p
(
φ
)
I
n
)
⋅
E
{\displaystyle {\begin{aligned}0&=\operatorname {adj} (\varphi I_{n}-A^{\operatorname {tr} })\cdot ((\varphi I_{n}-A^{\operatorname {tr} })\cdot E)\\&=(\operatorname {adj} (\varphi I_{n}-A^{\operatorname {tr} })\cdot (\varphi I_{n}-A^{\operatorname {tr} }))\cdot E\\&=(\det(\varphi I_{n}-A^{\operatorname {tr} })I_{n})\cdot E\\&=(p(\varphi )I_{n})\cdot E\end{aligned}}}
と計算できる。最初の等号は行列同士および行列とベクトルとの積の結合性によるが、この性質は行列やベクトルの成分がどのようなものであるかとは無関係に、これら積が持つ純形式的な性質である。さて、この等式の第 i 成分をみれば、p (φ )(ei ) = 0 ∈ V が成り立つことが分かるから、p (φ ) は全ての ei で— したがってそれらの生成する V 全体で— 消えていることになる。それはすなわち p (φ ) = 0 ∈ End(V ) であることに他ならないから、これで証明は完成する。
この証明を検討すれば、固有多項式をとる行列 A は、多項式に代入する値としての φ と同一である必要がないことが分かる。すなわち V 上の自己準同型 φ は、最初に与えた等式 φ (ei ) = ∑ j aji ⋅ ej を、何らかの元の列 e 1 , …, en に対して満足すればよい(これらの元の生成する空間を改めて V と書けば上記の証明を追うことができる)。この元の列には基底のような独立性は仮定しないでよいから、生成される空間の次元は n よりも小さくなり得るし、係数環が体でないときは自由加群 でない場合も出てくる。
そうして R を生成系 {e 1 , …, en } を持つ任意の可換環とし、R の自己準同型 φ の上記生成系に関する表現行列が A = (aij ) , すなわち
φ
(
e
j
)
=
∑
a
i
j
e
i
(
j
=
1
,
⋯
,
n
)
{\displaystyle \varphi (e_{j})=\sum a_{ij}e_{i}\qquad (j=1,\cdots ,n)}
を満たすものとする設定の下でのケイリー・ハミルトンの定理:pφ (φ ) = 0 が満足されることが正当化できる。
このように一般化された状況におけるこの定理は可換環論および代数幾何学において重要な中山の補題 の源流である。
注釈
四元数の乗法およびそれを用いた任意の構成(この文脈では特に行列式が顕著)には非可換性がかかわってくるから、十分に定義を検討する必要がある。分解型四元数 に対するケイリー・ハミルトンの定理も(やや素性はよくない (英語版 ) が)同様に成立する。四元数の場合も分解型四元数の場合も、ある種の複素2 次行列として表すことができる(ノルム 1 に制限すれば、これらの乗法の定める作用はそれぞれ特殊ユニタリ群 SU(2) および SU(1, 1) である)から、これらに対して定理が成り立つことは驚くことではない。そのような行列表現のできない八元数 (八元数の乗法は非結合的であるから行列の積で表現することは不合理)でさえ、それでも修正版のケイリー・ハミルトンの定理が満足される
「天然(の)」という意味ではなく、permutation(置換)と determinant(行列式)を合成したカバン語 のモジり。直訳的に合成すれば「置換式」。(テンソルの交代積に対する対称積のように、置換の符号 を掛ける部分を取り除いて)行列式の反対称性を対称性で置き換えた対応物なので「対称的行列式」のように呼べるかもしれない。
これら係数の陽な表示は
c
i
=
∑
k
1
,
k
2
,
⋯
,
k
n
∏
l
=
1
n
(
−
1
)
k
l
+
1
l
k
l
k
l
!
tr
(
A
l
)
k
l
{\displaystyle c_{i}=\sum _{k_{1},k_{2},\cdots ,k_{n}}\prod _{l=1}^{n}{\frac {(-1)^{k_{l}+1}}{l^{k_{l}}k_{l}!}}\operatorname {tr} (A^{l})^{k_{l}}}
で与えられる。ただし、和は ∑ n l =1 l⋅ kl = n − i を満たす分割 {kl ≥ 0} 全体の成す集合上を亙る
例えば(ヤコビの公式 を解いている)(Brown 1994 , p. 54) などを見よ:
∂
p
(
λ
)
/
∂
λ
=
p
(
λ
)
∑
m
=
0
∞
λ
−
(
m
+
1
)
tr
A
m
=
p
(
λ
)
tr
I
λ
I
−
A
≡
tr
B
,
{\displaystyle \partial p(\lambda )/\partial \lambda =p(\lambda )\sum _{m=0}^{\infty }\lambda ^{-(m+1)}\operatorname {tr} A^{m}=p(\lambda )\operatorname {tr} {\frac {I}{\lambda I-A}}\equiv \operatorname {tr} B,}
ただし B は後で述べる 随伴行列である。これと同値な、再帰的に関係したアルゴリズムをユルバン・ルヴェリエ とドミトリー・ファデーエフ (英語版 ) が導入した。そのファデーエフ–ルヴェリエアルゴリズム (英語版 ) からは
M
0
≡
O
,
c
n
=
1
(
k
=
0
)
M
k
≡
A
M
k
−
1
−
1
k
−
1
(
tr
(
A
M
k
−
1
)
)
I
,
c
n
−
k
=
−
1
k
tr
(
A
M
k
)
(
k
=
1
,
⋯
,
n
)
{\displaystyle {\begin{aligned}M_{0}&\equiv O,&c_{n}&=1\quad &(k&=0)\\M_{k}&\equiv AM_{k-1}-{\frac {1}{k-1}}(\operatorname {tr} (AM_{k-1}))I,&c_{n-k}&=-{\frac {1}{k}}\operatorname {tr} (AM_{k})&(k&=1,\cdots ,n)\end{aligned}}}
が導かれる(例えば Gantmacher 1960 , p. 88 を見よ)。 が再帰の終端となる。あとで述べる代数的証明では、件の随伴行列 Bk ≡ Mn− k の満たす性質に依拠している。具体的には
(
λ
I
−
A
)
B
=
I
p
(
λ
)
{\displaystyle (\lambda I-A)B=Ip(\lambda )}
および上記の p の微分を追跡すれば
λ
p
′
−
n
p
=
tr
(
A
B
)
{\displaystyle \lambda p'-np=\operatorname {tr} (AB)}
を得、上記の再帰手続きが順に繰り返される。
(佐武 1958 , p. 137, 注意)によれば、「行列係数の多項式に関して乗法の交換の法則は一般には成立しないが、それ以外(加減乗の演算に関する限り)通常の多項式と全く同様に取り扱うことができる.また行列係数の多項式の間の等式には,それら係数行列のすべてと交換可能な行列を代入することができる.(係数行列と非可換な行列は代入することができない.)行列係数の多項式に関して整除の問題は複雑である」とある。
行列式は行列の成分たちの積和であることを思い出そう。したがって、R 上の行列を成分に持つ行列の行列式はそれ自体が R 上の一つの行列である(係数環 R の元ではない)。つまり、区分行列の各ブロックをそれ自体一つの行列と見て、区分行列を行列の行列と考えるなら、その行列式はブロックたちの積和の形をしていなければならない。その一方、R 上の区分行列の成分は(ブロックではなくその中の)係数環 R の元自体であり、したがって区分行列の行列式はそれ自身もまた R の元であって、両者の概念は一般には一致しない。
Alagös, Y.; Oral, K.; Yüce, S. (2012). “Split Quaternion Matrices” . Miskolc Mathematical Notes 13 (2): 223-232. ISSN 1787-2405 . http://mat76.mat.uni-miskolc.hu/~mnotes/index.php?page=contents&volume=13&number=2 none (open access)
M. F. Atiyah ; I. G. Macdonald (1969), Introduction to Commutative Algebra , Westview Press, ISBN 978-0-201-40751-8
Asım Orhan Barut ; Zeni, J. R.; Laufer, A. (1994a). “The exponential map for the conformal group O(2,4)” . J. Phys. A: Math. Gen. 27 (15): 5239-5250. arXiv :hep-th/9408105 . doi :10.1088/0305-4470/27/15/022 . https://iopscience.iop.org/0305-4470/27/15/022/ .
Asım Orhan Barut; Zeni, J. R.; Laufer, A. (1994b). “The exponential map for the unitary group SU(2,2)” . J. Phys. A: Math. Gen. 27 (20): 6799-6806. arXiv :hep-th/9408145 . Bibcode : 1994JPhA...27.6799B . doi :10.1088/0305-4470/27/20/017 . https://iopscience.iop.org/0305-4470/27/20/017/ .
Bhatia, R. (1997). Matrix Analysis . Graduate texts in mathematics. 169 . Springer. ISBN 978-0387948461
Brown, Lowell S. (1994). Quantum Field Theory . Cambridge University Press . ISBN 978-0-521-46946-3
アーサー・ケイリー (1858), “A memoir on the theory of matrices”, Phil. Trans. R. Soc. Lond. 148 : 17-37, doi :10.1098/rstl.1858.0002
Cayley, A. (1889). The Collected Mathematical Papers of Arthur Cayley . (Classic Reprint). 2 . Forgotten books. ASIN B008HUED9O
Crilly, T. (1998). “The young Arthur Cayley”. Notes Rec. R. Soc. Lond. 52 (2): 267-282. doi :10.1098/rsnr.1998.0050 .
David Fairlie ; Thomas Curtright ; Cosmas Zachos (2014). “A compact formula for rotations as spin matrix polynomials”. SIGMA 10 (2014): 084. arXiv :1402.3541 . Bibcode : 2014SIGMA..10..084C . doi :10.3842/SIGMA.2014.084 .
Eisenbud, David (1995), Commutative Algebra: With a View Toward Algebraic Geometry , Graduate Texts in Mathematics, 150 , Springer-Verlag, doi :10.1007/978-1-4612-5350-1 , MR 1322960 , Zbl 0819.13001 , https://books.google.co.jp/books?id=xDwmBQAAQBAJ
フェルディナント・ゲオルク・フロベニウス (1878). “Ueber lineare Substutionen und bilineare Formen”. J. Reine Angew. Math. 84 : 1-63.
Gantmacher, F.R. (1960). The Theory of Matrices . NY: Chelsea Publishing. ISBN 978-0-8218-1376-8
Garrett, Paul B. (2007). Abstract Algebra . NY: Chapman and Hall/CRC. ISBN 978-1584886891
ウィリアム・ローワン・ハミルトン (1853). Lectures on Quaternions . Dublin
Hamilton, W. R. (1864a). “On a New and General Method of Inverting a Linear and Quaternion Function of a Quaternion”. Proceedings of the Royal Irish Academy viii : 182-183. (communicated on June 9, 1862)
Hamilton, W. R. (1864b). “On the Existence of a Symbolic and Biquadratic Equation, which is satisfied by the Symbol of Linear Operation in Quaternions”. Proceedings of the Royal Irish Academy viii : 190-201. (communicated on June 23, 1862)
Hou, S. H. (1998). “Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm”. SIAM Review 40 (3): 706-709. Bibcode : 1998SIAMR..40..706H . doi :10.1137/S003614459732076X . "Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm"
Hamilton, W. R. (1862). “On the Existence of a Symbolic and Biquadratic Equation which is satisfied by the Symbol of Linear or Distributive Operation on a Quaternion” . The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science . series iv 24 : 127-128. ISSN 1478-6435 . http://zs.thulb.uni-jena.de/rsc/viewer/jportal_derivate_00126615/PMS_1862_Bd24_%200135.tif 2015年2月14日 閲覧。 .
Alston Scott Householder (2006). The Theory of Matrices in Numerical Analysis . Dover Books on Mathematics. ISBN 978-0486449722
Laufer, A. (1997). “The exponential map of GL(N)” . J. Phys. A: Math. Gen. 30 (15): 5455-5470. arXiv :hep-th/9604049 . Bibcode : 1997JPhA...30.5455L . doi :10.1088/0305-4470/30/15/029 . https://iopscience.iop.org/0305-4470/30/15/029/ .
佐武一郎 『線型代数学』裳華房、1958年。
Tian, Y. (2000). “Matrix representations of octonions and their application”. Advances in Applied Clifford Algebras 10 (1): 61-90. arXiv :math/0003166v2 . doi :10.1007/BF03042010 . ISSN 0188-7009 .
Zeni, J. R.; Rodrigues, W.A. (1992). “A thoughful study of Lorentz transformations by Clifford algebras”. Int. J. Mod. Phys. A 7 (8): 1793 pp. Bibcode : 1992IJMPA...7.1793Z . doi :10.1142/S0217751X92000776 .
Zhang, F. (1997). “Quaternions and matrices of quaternions” . Linear Algebra and its Applications 251 : 21-57. doi :10.1016/0024-3795(95)00543-9 . ISSN 0024-3795 . http://www.sciencedirect.com/science/article/pii/0024379595005439 none (open archive).