Loading AI tools
矩陣的性質 来自维基百科,自由的百科全书
在數學上,特別是線性代數中,對於一個給定的方陣,它的特徵向量(eigenvector,也譯固有向量、本徵向量) 經過這個線性變換[a]之後,得到的新向量仍然與原來的 保持在同一條直線上,但其長度或方向也許會改變。即, 為純量,即特徵向量的長度在該線性變換下縮放的比例,稱 為其特徵值(eigenvalue,也譯固有值、本徵值)。如果特徵值為正,則表示 在經過線性變換的作用後方向也不變;如果特徵值為負,說明方向會反轉;如果特徵值為0,則是表示縮回零點。但無論怎樣,仍在同一條直線上。圖1給出了一個以油畫《蒙娜麗莎》為題材的例子。在一定條件下(如其矩陣形式為實對稱矩陣的線性變換),一個變換可以由其特徵值和特徵向量完全表述,也就是說:所有的特徵向量組成了這向量空間的一組基底。一個特徵空間(eigenspace)是具有相同特徵值的特徵向量與一個同維數的零向量的集合,可以證明該集合是一個線性子空間,比如 即為線性變換 中以 為特徵值的特徵空間。
這些概念在純數學和應用數學的眾多領域中都有重要的應用。在線性代數和泛函分析之外,甚至在一些非線性的情況下,這些概念都是十分重要的。
「特徵」一詞譯自德語的eigen,由希爾伯特在1904年首先在這個意義下使用(赫爾曼·馮·亥姆霍茲在更早的時候也在類似意義下使用過這一概念)。eigen一詞可翻譯為「自身的」,「特定於...的」,「有特徵的」或者「個體的」—這強調了特徵值對於定義特定的變換上是很重要的。
給定一個向量空間,從到自身的線性變換是一個保持向量加法和純量乘向量這兩種運算的函數,例如旋轉、反射、拉伸、壓縮,或者這些變換的組合等等[1]。一個線性變換可以通過它們在向量上的作用來可視化。一般來說,一個向量在經過映射之後可以變為任何可能的向量,而特徵向量具有更好的性質[2]。
一個線性變換的特徵向量 是一個非零向量[b]且在這個線性變換下的新向量為 簡單地乘以一個標量[2]。也就是說存在一個純量 使得滿足下式:
其中的縮放因子 稱為這個特徵向量的特徵值,或者說是線性變換的特徵值。反過來,一個實數是線性變換的一個特徵值,當且僅當有一個非零向量滿足上面的式子[2][3]。
所有具有相同的特徵值的特徵向量和零向量一起,組成了一個向量空間,稱為線性變換的一個特徵空間,一般記作[4]。這個特徵空間如果是有限維的,那麼它的維數叫做的幾何重數[5]。
變換的主特徵向量是模最大的特徵值對應的特徵向量[6]。有限維向量空間上的一個變換的譜是其所有特徵值的集合[7]。
特徵向量也可以看作是關於係數的方程:
的非零解。顯然只有在是變換的特徵值之時,方程才有非零解[8]。
最簡單的例子是恆等變換的特徵向量。由於對所有的非零向量,
所以所有的非零向量都是恆等變換的特徵向量,對應着特徵值1。恆等變換的特徵空間只有一個,就是整個空間,對應着特徵值1。[9]類似地,數乘變換的特徵向量也是所有非零向量,因為按照定義,對所有的非零向量,
如果一個變換可以寫成對角矩陣,那麼它的特徵值就是它對角線上的元素,而特徵向量就是相應的基。例如矩陣:
的特徵值就是2和4。2對應的特徵向量是所有形同的非零向量,而4對應的特徵向量是所有形同的非零向量。2對應的特徵空間是一個2維空間,而4對應的特徵空間是一個1維空間。矩陣的譜是。
對於更複雜的矩陣,特徵向量和特徵值就不是顯然的了。右圖中的例子是一個二維平面上的錯切變換,其矩陣可以表示為:
的特徵向量,按照定義,是在變換的作用下會得到自身的若干倍的非零向量。假設在的作用下變成了自身的倍,也就是
在等式兩邊的左側乘以單位矩陣I,得到
因此
根據線性方程組理論,為了使這個方程有非零解,矩陣的行列式必須是零:
det: determinant,行列式
按照行列式的展開定義,上面式子的左端是一個關於的多項式,稱為特徵多項式。這個多項式的係數只和有關。在這個例子中,可以計算這個特徵多項式:
在這種情況下特徵多項式的方程變成。它的唯一的解是:。這就是矩陣的特徵值。
找到特徵值後,就可以找出
的非零解,也就是特徵向量了。在例子中:
將代入,就有
解這個新矩陣方程,得到如下形式的解:
這裡的c是任意非零常量。因此,矩陣的特徵向量就是所有豎直方向的向量(比如圖中紅色箭頭代表的向量)。
一般來說,2×2的非奇異矩陣如果有兩個相異的特徵值,就有兩個線性無關的特徵向量。在這種情況下,對於特徵向量,線性變換僅僅改變它們的長度,而不改變它們的方向(除了反轉以外),而對於其它向量,長度和方向都可能被矩陣所改變。如果特徵值的模大於1,特徵向量的長度將被拉伸,而如果特徵值的模小於1,特徵向量的長度就將被壓縮。如果特徵值小於0,特徵向量將會被翻轉。
隨着地球的自轉,每個從地心往外指的箭頭都在旋轉,除了在轉軸上的那些箭頭。考慮地球在一小時自轉後的變換:地心指向地理南極的箭頭是這個變換的一個特徵向量,並且因為指向極點的箭頭沒有被地球的自轉拉伸,它的特徵值是1;但是從地心指向赤道任何一處的箭頭不會是一個特徵向量。
另一個例子是,薄金屬板關於一個固定點均勻伸展,使得板上每一個點到該固定點的距離翻倍。這個伸展是一個有特徵值2的變換。從該固定點到板上任何一點的向量是一個特徵向量,而相應的特徵空間是所有這些向量的集合。
但是,三維幾何空間不是唯一的向量空間。例如,考慮兩端固定的拉緊的繩子,就像弦樂器的振動弦那樣(圖2.)。振動弦的原子到它們在弦靜止時的位置之間的帶符號那些距離視為一個空間中的一個向量的分量,那個空間的維數就是弦上原子的個數。
如果考慮繩子隨着時間流逝發生的變換,它的特徵向量,或者說特徵函數(如果將繩子假設為一個連續媒介),就是它的駐波—也就是那些通過空氣的傳播讓人們聽到弓弦和吉他的撥動聲的振動。駐波對應於弦的特定振動,它們使得弦的形狀隨着時間變化而伸縮一個因子(特徵值)。和弦相關的該向量的每個分量乘上了一個依賴於時間的因子。駐波的振幅(特徵值)在考慮到阻尼的情況下逐漸減弱。因此可以將每個特徵向量對應於一個壽命,並將特徵向量的概念和共振的概念聯繫起來。
從數學上看,如果非零向量v與變換滿足
則稱向量v是變換的一個特徵向量,λ是相應的特徵值。其中是將變換作用於v得到的向量。
假設是一個線性變換,那麼v可以由其所在向量空間的一組基表示為:
其中是向量在基向量上的投影(即坐標),這裡假設向量空間為n 維。由此,可以直接以坐標向量表示。利用基向量,線性變換也可以用一個簡單的矩陣乘法表示。上述的特徵值方程可以表示為:
但是,有時候用矩陣形式寫下特徵值方程是不自然甚或不可能的。例如在向量空間是無窮維的時候,上述的弦的情況就是一例。取決於變換和它所作用的空間的性質,有時將特徵值方程表示為一組微分方程更好。若是一個微分算子,其特徵向量通常稱為該微分算子的特徵函數。例如,微分本身是一個線性變換因為(若M和N是可微函數,而a和b是常數)
考慮對於時間的微分。其特徵函數滿足如下特徵值方程:
其中λ是該函數所對應的特徵值。這樣一個時間的函數,如果,它就不變,如果為正,它就按比例增長,如果是負的,它就按比例衰減。例如,理想化的兔子的總數在兔子更多的地方繁殖更快,從而滿足一個正λ的特徵值方程。
該特徵值方程的解是,也即指數函數;這樣,該函數是微分算子d/dt的特徵值為λ的特徵函數。若λ是一個負數,我們稱N的演變為一個指數衰減;若它是正數,則稱指數增長。λ的值可以是一個任意複數。因此d/dt的譜是整個複平面。在這個例子中,算子d/dt作用的空間是單變量可微函數的空間。該空間有無窮維(因為不是每一個可微函數都可以用有限的基函數的線性組合來表達的)。但是,每個特徵值λ所對應的特徵空間是一維的。它就是所有形為的函數的集合。N0是任意常數,也就在t=0的初始數量。
譜定理在有限維的情況,將所有可對角化的矩陣作了分類:它顯示一個矩陣是可對角化的,當且僅當它是一個正規矩陣。注意這包括自共軛(厄爾米特)的情況。這很有用,因為對角化矩陣T的函數f(T)(譬如博雷爾函數f)的概念是清楚的。在採用更一般的矩陣的函數的時候譜定理的作用就更明顯了。例如,若f是解析的,則它的形式冪級數,若用T取代x,可以看作在矩陣的巴拿赫空間中絕對收斂。譜定理也允許方便地定義正算子的唯一的平方根。
譜定理可以推廣到希爾伯特空間上的有界正規算子,或者無界自共軛算子的情況。
假設我們想要計算給定矩陣的特徵值。若矩陣很小,我們可以用特徵多項式進行符號演算。但是,對於大型矩陣這通常是不可行的,在那種情況我們必須採用數值方法。
描述正方形矩陣的特徵值的重要工具是特徵多項式:就如之前的例子一樣,說λ是A的特徵值等價於說線性系統(A – λI)v = 0(其中I是單位矩陣)有非零解v(一個特徵向量),因此等價於說行列式:
函數:是一個關於λ的多項式,稱為A的特徵多項式。矩陣的特徵值也就是其特徵多項式的零點。求一個矩陣A的特徵值可以通過求解方程來得到。
若A是一個n×n矩陣,則為n次多項式,因而A最多有n個特徵值。反過來,如果A的係數是在一個代數閉域裡面(比如說複數域),那麼代數基本定理說明這個方程剛好有n個根(如果重根也計算在內的話)。所有奇數次的多項式必有一個實數根,因此當n為奇數的時候,每個n維實係數矩陣至少有一個實數特徵值。當矩陣係數是實數的時候,非實數的特徵值會成共軛對出現。
一旦找到特徵值λ,相應的特徵向量就可以通過求解如下方程得到:
實係數的矩陣不一定有實數特徵值。比如對於以下的矩陣(表示二維平面上的順時針90°的一個旋轉變換):
其特徵多項式是,因此其特徵值成復共軛對出現,分別是i和-i,而沒有實數特徵值。相應的特徵向量也是非實數的。
在實踐中,大型矩陣的特徵值無法通過特徵多項式計算。計算該多項式本身相當費資源,而根的精確表達式對於高次的多項式來說很難計算和表達:阿貝爾-魯菲尼定理顯示五次或更高次的多項式的根無法用次方根來簡單表達。對於估算多項式的根的有效算法是有的,但特徵值中的微小誤差可以導致特徵向量的巨大誤差。因此,尋找特徵多項式和特徵值的一般算法,是迭代法。最簡單的方法是冪法:取一個隨機向量,然後計算如下的一系列單位向量
這個序列幾乎總是收斂於最大絕對值的特徵值所對應的特徵向量。這個算法很簡單,但是本身不是很有用。但是,像QR分解這樣的算法正是以此為基礎的[10]。
A的一個特徵值λ的代數重數是λ作為A的特徵多項式的根的次數;換句話說,若r是該多項式的一個根,它是一次多項式因子(λ - r)在特徵多項式中在因式分解後中出現的次數。如果將代數重次計算在內的話,一個n×n矩陣有n個特徵值,因為其特徵多項式次數為n。
一個代數重次1的特徵值為「單特徵值」。
在關於矩陣理論的條目中,可能會遇到如下的表示方法:
表示4的代數重次為二,3的是三,2的是二,而1的是1。這樣寫是因為代數重次對於矩陣理論中的很多證明很重要而被大量使用。
和代數重數相對的是特徵值的幾何重數:特徵值相對應的特徵空間(也就是λI − A的零空間)的維數。代數重次也可以視為一種維數:它是相應廣義特徵空間的維數,也就是當自然數k足夠大的時候矩陣(λI − A)k的零空間。也就是說,它是所有「廣義特徵向量」組成的空間,其中一個廣義特徵向量是任何一個如果λI − A作用連續作用足夠多次就「最終」會變0的向量。任何特徵向量都是一個廣義特徵向量,以此任一個特徵空間都被包含於相應的廣義特徵空間。這給了一個幾何重次總是小於或等於代數重次的簡單證明。
例如:
它只有一個特徵值,也就是λ = 1。其特徵多項式是,所以這個特徵值代數重次為2。但是,相應特徵空間是通常稱為x軸的數軸,由向量線性生成,所以幾何重次只是1。
廣義特徵向量可以用於計算一個矩陣的若爾當標準型(參看下面的討論)。若爾當塊通常不是對角化而是冪零的這個事實與特徵向量和廣義特徵向量之間的區別直接相關。
如上所述,譜定理表明正方形矩陣可以對角化當且僅當它是正規的。對於更一般的未必正規的矩陣,我們有類似的結果。當然在一般的情況,有些要求必須放鬆,例如酉等價性或者最終的矩陣的對角性。所有這些結果在一定程度上利用了特徵值和特徵向量。下面列出了一些這樣的結果:
譜在相似變換下不變:矩陣A和P-1AP有相同的特徵值,這對任何矩陣A和任何可逆矩陣P都成立。譜在轉置之下也不變:矩陣A和AT有相同的特徵值。
因為有限維空間上的線性變換是雙射當且僅當它是單射,一個矩陣可逆當且僅當所有特徵值都不是0。
若爾當分解的一些更多的結果如下:
正規矩陣的一些子類的譜的位置是:
假設A是一個m×n矩陣,其中m ≤ n,而B是一個n×m矩陣。則BA有和AB相同的特徵值加上n − m個等於0的特徵值。
每個矩陣可以被賦予一個算子範數。算子範數是其特徵值的模的上確界,因而也是它的譜半徑。該範數直接和計算最大模的特徵值的冪法直接相關。當一個矩陣是正規的,其算子範數是其特徵值的最大模,並且獨立於其定義域的範數。
一個共軛特徵向量或者說共特徵向量是一個在變換下成為其共軛乘以一個標量的向量,其中那個標量稱為該線性變換的共軛特徵值或者說共特徵值。共軛特徵變量和共軛特徵值代表了和常規特徵向量和特徵值相同的信息和含義,但是在交替坐標系統被使用的時候出現。對應的方程是:
例如,在相干電磁散射理論中,線性變換A代表散射物體施行的作用,而特徵向量表示電磁波的極化狀態。在光學中,坐標系統按照波的觀點定義,稱為前向散射對齊(FSA),從而導致了常規的特徵值方程,而在雷達中,坐標系統按照雷達的觀點定義,稱為後向散射對齊(BSA),從而給出了共軛特徵值方程。
一個廣義特徵值(第二種意義)有如下形式
其中A和B為矩陣。其廣義特徵值(第二種意義)λ 可以通過求解如下方程得到
形如的矩陣的集合,其中是一個複數,稱為一個「束(pencil)」。若B可逆,則最初的問題可以寫作如下形式
也即標準的特徵值問題。但是,在很多情況下施行逆操作是不可取的,而廣義特徵值問題應該如同其原始表述來求解。
如果A和B是實係數的對稱矩陣,則特徵值為實數。這在上面的第二種等價表述中並不明顯,因為矩陣未必是對稱的。
這裡的一個例子是分子軌道應用如下。
在方矩陣A,其係數屬於一個環的情況,λ稱為一個右特徵值如果存在一個列向量x使得Ax=λx,或者稱為一個左特徵值如果存在非零行向量y使得yA=yλ。
若向量空間是無窮維的,特徵值的概念可以推廣到譜的概念。譜是標量λ的集合,對於這些標量,沒有定義,也就是說它們使得沒有有界逆。
很明顯,如果λ是T的特徵值,λ位於T的譜內。一般來講,反過來並不成立。在希爾伯特空間或者巴拿赫空間上有一些算子完全沒有特徵向量。這可以從下面的例子中看到。在希爾伯特空間(所有標量級數的空間,每個級數使得收斂)上的雙向平移沒有特徵向量卻有譜值。
在無窮維空間,有界算子的譜系總是非空的,這對無界自共軛算子也成立。通過檢驗譜測度,任何有界或無界的自共軛算子的譜可以分解為絕對連續,離散,和孤立部分。指數增長或者衰減是連續譜的例子,而振動弦駐波是離散譜例子。氫原子是兩種譜都有出現的例子。氫原子的束縛態對應於譜的離散部分,而離子化狀態用連續譜表示。
在量子力學中,不含時薛定諤方程是一個以微分算子代表的變換的特徵值方程,能夠描述一個粒子的量子行為:
其中,是哈密頓算子,一個二階微分算子,是描述粒子的量子行為的波函數,對應於特徵值的特徵函數,該值可以解釋為粒子的能量。
假設,我們只想尋找薛定諤方程的束縛態(bound state)解,那麼,可以在平方可積函數的空間中尋找。由於這個空間是希爾伯特空間,有一個定義良好的標量積,我們可以引入一個基集合,然後表示和為一個一維數組和一個矩陣。這樣,我們能夠用矩陣形式表達薛定諤方程。(圖3表示氫原子哈密頓算子的最低能級特徵函數。)
狄拉克標記經常在這個上下文中使用,以強調量子態的態向量和它表示於位置空間的波函數之間的區別。採用狄拉克標記,薛定諤方程寫為
並稱是的一個本徵態(有時候在入門級課本中寫作),是一個自伴算子(參看可觀察量)。在上述方程中,理解為通過作用於得到的一個新的態向量。
在量子力學中,特別是在原子物理和分子物理中,在Hartree-Fock理論下,原子軌域和分子軌域可以定義為Fock算子的特徵向量。相應的特徵值通過Koopmans定理可以解釋為電離勢能。在這個情況下,特徵向量一詞可以用於更廣泛的意義,因為Fock算子顯式地依賴於軌道和它們地特徵值。如果需要強調這個特點,可以稱它為隱特徵值方程。這樣地方程通常採用迭代程序求解,在這個情況下稱為自洽場方法。在量子化學中,經常會把Hartree-Fock方程通過非正交基集合來表達。這個特定地表達是一個廣義特徵值問題稱為Roothaan方程。
在因素分析中,一個協方差矩陣的特徵向量對應於因素,而特徵值是因素負載。因素分析是一種統計學技術,用於社會科學和市場分析、產品管理、運籌規劃和其他處理大量數據的應用科學。其目標是用稱為因素的少量的不可觀測隨機變量來解釋在一些可觀測隨機變量中的變化。可觀測隨機變量用因素的線性組合來建模,再加上「殘差項。
懸臂樑的幾種振動模態 | ||
---|---|---|
在對於多自由度機械結構作振動分析時,常常會遇到特徵值問題。經過仔細解析,求得的特徵值會給出振動的自然頻率,而特徵向量則會給出振動模態的振動行為。由於特徵向量的相互正交性質,允許對應的微分方程式能夠解耦合(decouple),整個系統可以表示為特徵向量的線性總和。有限元分析是一種非常優良的方法,時常用來解析複雜結構的特徵值問題。
在圖像處理中,臉部圖像的處理可以看作分量為每個像素的灰度的向量。該向量空間的維數是像素的個數。一個標準化面部圖形的一個大型數據集合的協方差矩陣的特徵向量稱為特徵臉。它們對於將任何面部圖像表達為它們的線性組合非常有用。特徵臉提供了一種用於識別目的的數據壓縮的方式。在這個應用中,一般只取那些最大特徵值所對應的特徵臉[11]。
採用直角坐標系的三個坐標軸為參考軸,一個剛體的慣性張量,以矩陣形式表達為
其中,矩陣的元素以方程式表達為
是剛體內部的微小體積元的位置。
慣性張量是個實值的三維對稱矩陣,對角元素、、分別為剛體對於x-軸、y-軸、z-軸的轉動慣量。非對角元素是剛體對於-軸和-軸的慣量積。根據譜定理,可以使慣性張量成為一個對角矩陣[12]。所得到的三個特徵值必是正實值;三個特徵向量必定互相正交。
換另外一種方法,我們需要求解特徵方程式
這方程式的三個根、、都是正實的特徵值。將特徵值代入特徵方程式,再加上方向餘弦(directional cosine)方程式,
在固體力學中,應力張量是對稱的,因而可以分解為對角張量,其特徵值位於對角線上,而特徵向量可以作為基。因為它是對角陣,在這個定向中,應力張量沒有剪切分量;它只有主分量。
在譜系圖論中,一個圖的特徵值定義為圖的鄰接矩陣A的特徵值,或者(更多的是)圖的拉普拉斯算子矩陣,其中T是對角陣表示每個頂點的度數,在中,0用於取代。圖的主特徵向量用於測量其頂點的中心度。Google的PageRank算法就是一個例子。www圖的修正鄰接矩陣的主特徵向量的分量給出了頁面評分。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.