在數學中,矩陣微積分是多元微積分的一種特殊表達,尤其是在矩陣空間上進行討論的時候。它把單個函數對多個變量或者多元函數對單個變量的偏導數寫成向量和矩陣的形式,使其可以被當成一個整體被處理。這使得要在多元函數尋找最大或最小值,又或是要為微分方程系統尋解的過程大幅簡化。這裡我們主要使用統計學和工程學中的慣用記法,而張量下標記法更常用於物理學中。
| 此條目需要精通或熟悉相關主題的編者參與及協助編輯。 (2019年3月5日) |
在本小節中,我們在表示向量和矩陣時,通過用單個變量來表示許多變量的方式,把矩陣記法的效用發揮到最大。接下來我們用不同字體來區分標量、向量和矩陣。我們使用M(n,m)來表示包含n行m列的n×m實矩陣的空間。該空間中的一般矩陣用粗體大寫字母表示,例如A,X,Y等。而若該矩陣屬於M(n,1),即列向量,則用粗體小寫字母表示,如a,x,y等。特別地,M(1,1)中的元素為標量,用小寫斜體字母表示,如a,t,x等。XT 表示矩陣轉置,tr(X)表示矩陣的跡,而 det(X)或|X|表示行列式。除非專門註明,所有函數都默認屬於光滑函數C1。 通常字母表前半部分的字母(a, b, c, …)用於表示常量,而後半部分的字母(t, x, y, …)用於表示變量。
由於向量可看成僅有一列的矩陣,最簡單的矩陣求導為向量求導。
這裡的標記方法可以通過如下方式表達大部分向量微積分:把n維向量構成的空間M(n,1)等同為歐氏空間 Rn, 標量M(1,1)等同於R。對應的向量微積分的概念在每小節末尾列出。
標量y對向量的導數可以(用分子記法)寫成
在向量微積分中,標量y在的空間Rn(其獨立坐標是x的分量)中的梯度是標量y對向量x的導數的轉置。在物理學中,電場是電勢的負梯度向量。
標量函數f(x)對空間向量x在單位向量u(在這裡表示為列向量)方向上的方向導數可以用梯度定義:
使用剛才定義的標量對向量的導數的記法,我們可以把方向導數寫作
這類記法在證明乘法法則和鏈式法則的時候非常直觀,因為它們與我們熟悉的標量導數的形式較為相似。
前面兩種情況可以看作是向量對向量求導在其中一個是一維向量情況下的特例。類似地我們將會發現有關矩陣的求導可被以一種類似的方式化歸為向量求導。
向量函數 (分量為函數的向量) 對輸入向量的導數,可以(用分子記法) 寫作
在向量微積分中,向量函數y對分量表示一個空間的向量x的導數也被稱為前推 (微分),或雅可比矩陣。
向量函數f對Rn空間中向量v的前推為
有兩種類型的矩陣求導可以被寫成相同大小的矩陣:矩陣對標量求導和標量對矩陣求導。它們在解決應用數學的許多領域常見的最小化問題中十分有用。類比於向量求導,相應的概念有切矩陣和梯度矩陣。
矩陣函數Y對標量x的導數被稱為切矩陣,(用分子記法)可寫成:
定義在元素是獨立變量的p×q矩陣X上的標量函數y對X的導數可以(用分子記法)寫作
定義矩陣上的重要的標量函數包括矩陣的跡和行列式。
類比於向量微積分,這個導數常被寫成如下形式:
類似地,標量函數f(X)關於矩陣X在方向Y的方向導數可寫成
梯度矩陣經常被應用在估計理論的最小化問題中,比如卡爾曼濾波算法的推導,因此在這些領域中有着重要的地位。
- Lax, Peter D. 9. Calculus of Vector- and Matrix-Valued Functions. Linear algebra and its applications 2nd. Hoboken, N.J.: Wiley-Interscience. 2007. ISBN 978-0-471-75156-4.