Loading AI tools
在方块矩阵上计算得到的标量 来自维基百科,自由的百科全书
行列式(英語:Determinant),记作或,是一个在方块矩阵上计算得到的标量。行列式可以看作是有向面积或体积的概念在一般的欧几里得空间中的推广。或者说,在欧几里得空间中,行列式描述的是一个线性变换对“体积”所造成的影响。无论是在线性代数、多项式理论,还是在微积分学中(比如说换元积分法中),行列式作为基本的数学工具,都有着重要的应用。
此條目的引用需要清理,使其符合格式。 (2024年6月25日) |
「横(row)」的各地常用名稱 | |
---|---|
中国大陸 | 行 |
臺灣 | 列[1] |
行列式概念最早出现在解线性方程组的过程中。十七世纪晚期,关孝和与莱布尼茨的著作中已经使用行列式来确定线性方程组解的个数以及形式。十八世纪开始,行列式开始作为独立的数学概念被研究。十九世纪以后,行列式理论进一步得到发展和完善。矩阵概念的引入使得更多有关行列式的性质被发现,行列式在许多领域都逐渐显现出重要的意义和作用,其定义也被推广到诸如线性自同态和向量组等结构上。
矩陣的行列式記作。行列式經常使用竖直線記法(例如:克萊姆法則和子式)。例如,对于一個矩陣:
也记作,或以細長的垂直線取代矩陣的方括號,明確的寫为[3][4]:
当这个记法用于絕對值时,其作用对象为数,矩陣的絕對值是无定義的。矩陣範數通常以雙垂直線來表示(如:),且可以使用下標。故不会与二者造成混淆。
其中,是集合上置换的全体,即集合到自身上的一一映射(双射)的全体;
表示对全部元素的求和,即对于每个,在加法算式中出现一次;对每一个满足的数对,是矩阵的第行第列的元素。
表示置换的符号差,具体地说,满足但的有序数对称为的一个逆序。
如果的逆序共有偶数个,则,如果共有奇数个,则。
举例来说,对于3元置换(即是说,,)而言,由于1在2后,1在3后,所以共有2个逆序(偶数个),因此,从而3阶行列式中项的符号是正的。但对于三元置换(即是说,,)而言,可以数出共有3个逆序(奇数个),因此,从而3阶行列式中项的符号是负号[5][6]。
注意到对于任意正整数,共拥有n!个元素,因此上式中共有个求和项,即这是一个有限多次的求和。
对于简单的2阶和3阶的矩阵,行列式的表达式相对简单,而且恰好是每条主对角线(左上至右下)元素乘积之和减去每条副对角线(右上至左下)元素乘积之和(见图中红线和蓝线)。
但对于阶数的方阵,这样的主对角线和副对角线分别只有条,由于的主、副对角线总条数的元素个数 因此,行列式的相加项中除了这样的对角线乘积之外,还有其他更多的项。例如4阶行列式中,项就不是任何对角线的元素乘积。不过,和2、3阶行列式情况相同的是,n阶行列式中的每一项仍然是从矩阵中选取n个元素相乘得到,且保证在每行和每列中都恰好只选取一个元素,而整个行列式恰好将所有这样的选取方法遍历一次。
行列式的一个自然的源起是n维平行体的体积。行列式的定义和n维平行体的体积有着本质上的关联[10]。
比如说,两个向量和的行列式是:
经计算可知,当系数是实数时,行列式表示的是向量和形成的平行四边形的有向面积,并有如下性质:
其几何意义是:以同一个向量作为一条边的两个平行四边形的面积之和,等于它们各自另一边的向量和加起来后的向量:和所构成的平行四边形的面积,如左图中所示。
在三维的有向空间中,三个三维向量的行列式是:
比如说,三个向量、和的行列式是:
当系数是实数时,行列式表示、和三个向量形成的平行六面体的有向体积,也叫做这三个向量的混合积。同样的,可以观察到如下性质[12]:
在以上的行列式中,我们不加选择地将向量在所谓的正交基(即直角坐标系)下分解,实际上在不同的基底之下,行列式的值并不相同。这并不是说平行六面体的体积不唯一。恰恰相反,这说明体积的概念依赖于衡量空间的尺度,也就是基底的取法。用基底的变换可以看作线性映射对基底的作用,而不同基底下的行列式代表了基变换对“体积”的影响。可以证明,对于所有同定向的标准正交基,向量组的行列式的值在绝对值意义上是一样的[14]。也就是说,如果我们选择的基底都是“单位长度”,并且两两正交,那么在这样的基之下,平行六面体的体积的绝对值是唯一的[15]。
设E是一个一般的n维的有向欧几里得空间。一个线性变换把一个向量线性地变为另一个向量。比如说,在三维空间中,向量()被映射到向量():
其中、、是系数。如右图,正方体(可以看作原来的一组基形成的)经线性变换后可以变成一个普通的平行六面体,或变成一个平行四边形(没有体积)。这两种情况表示了两种不同的线性变换,行列式可以将其很好地分辨出来(为零或不为零)。
更详细地说,行列式表示的是线性变换前后平行六面体的体积的变化系数。如果设左边的正方体体积是一,那么中间的平行六面体的(有向)体积就是线性变换的行列式的值,右边的平行四边形体积为零,因为线性变换的行列式为零。这里我们混淆了线性变换的行列式和向量组的行列式,但两者是一样的,因为我们在对一组基作变换[16]。
以上二维和三维行列式的例子中,行列式被解释为向量形成的图形的面积或体积。面积或体积的定义是恒正的,而行列式是有正有负的,因此需要引入有向面积和有向体积的概念。负的面积或体积在物理学中可能难以理解,但在数学中,它们和有向角的概念类似,都是对空间镜面对称特性的一种刻画。如果行列式表示的是线性变换对体积的影响,那么行列式的正负就表示了空间的定向[17]。
如上图中,左边的黄色骰子(可以看成有单位的有向体积的物体)在经过了线性变换后变成中间绿色的平行六面体,这时行列式为正,两者是同定向的,可以通过旋转和拉伸从一个变成另一个。而骰子和右边的红色平行六面体之间也是通过线性变换得到的,但是无论怎样旋转和拉伸,都无法使一个变成另一个,一定要通过镜面反射才行。这时两者之间的线性变换的行列式是负的。可以看出,线性变换可以分为两类,一类对应着正的行列式,保持空间的定向不变,另一类对应负的行列式,颠倒空间的定向[17][18][19]。
由二维及三维的例子,可以看到一般的行列式应该具有怎样的性质。在维欧几里得空间中,作为“平行多面体”的“体积”的概念的推广,行列式继承了“体积”函数的性质。首先,行列式需要是线性的,这可以由面积的性质类比得到。这裡的线性是对于每一个向量来说的,因为当一个向量变为原来的倍时,“平行多面体”的“体积”也变为原来的倍。其次,当一个向量在其它向量组成的“超平面”上时,维“平行多面体”的“体积”是零(可以想像三维空间的例子)。也就是说,当向量线性相关时,行列式为零。在一般系数域上的线性空间中,行列式也正是由这样的特性所刻划的:
行列式是系数域为的有限维线性空间上射到的交替n-线性形式[20]。
具体来说,设是一个系数在域上的有限维线性空间,维数为。一个上的交替线性形式是指满足以下性质的函数:
所有E上的交替线性形式的集合记作。
对任一个线性形式,考虑将依照多线性性质展开,
这时,由交替性,当且仅当是的一个排列,所以有
这裡,。
设是的一组基,根据上面的定理和线性形式的性质,可以定义下的行列式。
其中的唯一性是因为如果有两个交替线性形式满足条件,则它们的差在一组基上为0,从而恒等于0。于是,一组基上的一个向量组的行列式就是:
确定了上的一组基后,向量组在下的行列式是:
可以见到这个定义与之前直观的定义是吻合的,它有时也被称作莱布尼兹公式。
设与是向量空间中的两组基,则将上面定理中的改为就得到向量组在两组基下的行列式之间的关系:
設為所有定義在系数域上的矩陣的集合。將矩陣(的元素记为 )的列寫成,可以看作是的正则基上的向量。矩阵的行列式定义为向量组的行列式。这裡的向量都在的正则基上展开,因此矩阵的行列式不依赖于基的选择。
矩阵的行列式
这样定义的矩阵的行列式与向量组的行列式有同样的性质。单位矩阵的行列式为1,若矩阵的某几行线性相关,则它的行列式为零。
由莱布尼兹公式,可以证明矩阵行列式的一个重要性质:
也就是说矩阵的行列式既可以看作个行向量的行列式,也可以看作个列向量的行列式。因此也可以通过行向量组来定义矩阵行列式,并且得到的定义是等价的。
设是维线性空间到自身的线性变换(自同态),对于给定的一组基,可以定义线性变换在这组基下的行列式。
f的变换矩阵满足 也就是说对所有的向量组,
可以证明,f在E的任意一组基下的变换矩阵的行列式都是相等的[25]。
考虑映射使得被映射到
是一个交替n-线性形式,因此由前面证的定理,和只相差一个系数。
而由变换矩阵的性质可以知道:
也就是说
对于另外一组基,运用基变更公式,可以得到:
从而可以得出等于。于是是一个不依赖于基,只依赖于f的数。
因此线性变换的行列式定义可以修改为不依赖于基的形式:
设线性变换f在某组基B下的变换矩阵为,那么的行列式就是:
前一节里对正方体做线性变换时,是原来的基,,因此可以混淆向量组的行列式和线性变换的行列式[25]。
特别地,行列式为1的线性变换保持向量组的行列式,它们构成一般线性群的一个子群,称作特殊线性群[26]。可以证明,是由所有的错切生成的,即所有具有如下形式的矩阵代表的线性变换:
其中是只在第行第列处系数取1,其余系数为0的矩阵。也就是说,错切变换保持向量组形成的“平行多面体”的体积[27]。同样,可以证明两个相似矩阵有相等的行列式[28]。
以上的定义中都假设矩阵的系数取自域中,实际上矩阵的系数可以是任意的交换环,这时有限维线性空间变为以为基的自由模,而相应的关于行列式的定义和性质依然成立(在可定义的范畴内)。如果矩阵系数是非交换环的话,以上的行列式定义将不再唯一。1845年,阿瑟·凯莱首次开始研究非交换环上行列式定义的问题。他注意到,对于系数是四元数(不可交换)的二阶行列式
表达式和是不一样的。1926年,阿兰德·海廷和A.理查德森提出了非交换环上的行列式的不同定义。理查德森将二阶行列式定义为:,而海廷则提倡使用。两人都用归纳法定义了更高阶矩阵的行列式。1931年,奥斯丁·欧尔在一大类非交换环(后来命名为欧尔环)上定义了行列式的概念。最著名的非交换环上的行列式的定义当属让·迪厄多内的定义。迪厄多内是布尔巴基学派的代表成员之一,他将除环中的行列式定义在商域上,而不是在中。这个定义下的行列式有接近交换环中行列式的性质。例如,迪尔多内的行列式可以保持行列式的乘法定理。而这种行列式与交换环中行列式的区别是:将矩阵的两行或两列互换后,行列式的值不变。[29]之后菲列克斯·别列金(Березин, Феликс Александрович)、佐藤幹夫等人对迪厄多内的定义进行了探究和扩展[30]。
行列式的一些基本性质,可以由它的多线性以及交替性推出。
关于元素的代数余子式记作。[42]。
一个阶的行列式可以写成一行(或一列)的元素与对应的代数余子式的乘积之和,叫作行列式按一行(或一列)的展开。
这个公式又称拉普拉斯公式,把维矩阵的行列式计算变为了个维的行列式的计算[42][43]。另一方面,拉普拉斯公式可以作为行列式的一种归纳定义:在定义了二维行列式后,维矩阵的行列式可以借助拉普拉斯公式用维的行列式来定义。这样定义的行列式与前面的定义是等价的[10]。
计算行列式的值是一个常见的问题。最简单的方法是按照定义计算或按照拉普拉斯公式进行递归运算。这样的算法需要计算次的加法,复杂度是指数函数。在实际的计算中只能用于计算阶数很小的行列式。注意到拉普拉斯公式的性质,如果一行或一列里面有很多个0,那么就可以把行列式按这一行或一列展开,这时数值为零的系数所对应的代数余子式就不必计算了,因为最后要乘以0,这样就可以简化计算。然而更加简便的算法是利用高斯消去法或LU分解法,把矩阵通过初等变换变成三角矩阵或三角矩阵的乘积来计算行列式的值。这些算法的复杂度都是级别,远远小于直接计算的复杂度。
如果一个算法可以在时间内算出矩阵乘法,那么可以构造出一种时间内的行列式求值算法。这说明求矩阵的行列式的值和矩阵的乘法有相同的复杂度。于是,通过分治算法或者其它的方法,可以达到比更好的结果。比如,存在复杂度的行列式求值算法[44][45]。
由行列式的一般表达形式中可以看出,矩阵的行列式是关于其系数的多项式。因此行列式函数具有良好的光滑性质。
设矩阵函数为(k阶连续可导)的函数,则由于行列式函数只不过是矩阵的某些系数的乘积,所以也是的。其对t的导数为
函数是连续的。由此,n阶一般线性群是一个开集,因为是开区间的原像,而特殊线性群则是一个闭集,因为是闭集合的原像[47]。
函数也是可微的,甚至是光滑的()[48]。它在某个矩阵处的展开为
行列式与外代数有密切的关系,因为外代数正是在给定的交换环上的自由-模上最“一般性”的有交替性质的结合代数,记为。外代数是由楔积构造而成的,而楔积在上的交替性质表现如下(定义):
这表示
对三维欧几里得空间中可以建立一个线性同构如下:任取的右手的标准正交基,,,规定把,,分别映射为,,,则的定义与右手的标准正交基如何选取无关。
不难看出,对任意向量和,这个线性同构把楔积映射为叉积。这就是叉乘(向量积)的实质。叉积可以用带向量的行列式:
来表示,但要注意这个行列式形式并不代表一个“真正”的行列式,因为第一行的分量不是数,而是向量。这个计算之所以正确是得益于线性同构。[53]
行列式的概念最初是伴随着方程组的求解而发展起来的。行列式的提出可以追溯到十七世纪,最初的雏形由日本数学家关孝和与德国数学家戈特弗里德·莱布尼茨各自独立得出,时间相差132年。
1545年,吉罗拉莫·卡尔达诺在著作《大术》(Ars Magna)中给出了一种解两个一次方程组的方法。他把这种方法称为“母法”(regula de modo)。这种方法和后来的克莱姆法则已经很相似了,但卡尔达诺并没有给出行列式的概念[54]。
1683年,日本数学家关孝和在其著作《解伏题之法》中首次引进了行列式的概念。书中出现了、乃至的行列式,行列式被用来求解高次方程组[55][56]。
1693年,德国数学家莱布尼茨开始使用指标数的系统集合来表示有三个未知数的三个一次方程组的系数。他从三个方程的系统中消去了两个未知量后得到一个行列式。这个行列式不等于零,就意味着有一组解同时满足三个方程[57][58][55]。由于当时没有矩阵的概念,莱布尼茨将行列式中元素的位置用数对来表示:ij代表第i行第j列。莱布尼茨对行列式的研究成果中已经包括了行列式的展开和克莱姆法则,但这些结果在当时并不为人所知[59]。
1730年,苏格兰数学家科林·麦克劳林在他的《论代数》中已经开始阐述行列式的理论,记载了用行列式解二元、三元和四元一次方程的方法,并给出了四元一次方程组的一般解的正确形式,尽管这本书直到麦克劳林逝世两年后(1748年)才得以出版[60]。
1750年,瑞士的加布里尔·克莱姆首先在他的《代数曲线分析引论》给出了n元一次方程组求解的法则,用于确定经过五个点的一般二次曲线的系数,但并没有给出证明[61]。其中行列式的计算十分复杂,因为是定义在奇置换和偶置换上的[62]。
此后,关于行列式的研究逐渐增多。1764年,法国的艾蒂安·裴蜀的论文中关于行列式的计算方法的研究简化了克莱姆法则,给出了用结式来判别线性方程组的方法[55][63]。同是法国人的范德蒙德则在1771年的论著中第一个将行列式和解方程理论分离,对行列式单独作出阐述。这是数学家们开始对行列式本身进行研究的开端[64]。
1772年,皮埃尔-西蒙·拉普拉斯在论文《对积分和世界体系的探讨》中推广了范德蒙德著作裡面将行列式展开为若干个较小的行列式之和的方法,发展出子式的概念。一年后,约瑟夫·拉格朗日发现了的行列式与空间中体积的联系。他发现:原点和空间中三个点所构成的四面体的体积,是它们的坐标所组成的行列式的六分之一[65][55]。
行列式在大部分欧洲语言中被称为“determinant”(某些语言中词尾加e或o,或变成s),这个称呼最早是由卡爾·弗里德里希·高斯在他的《算术研究》中引入的。这个称呼的词根有“决定”意思,因为在高斯的使用中,行列式能够决定二次曲线的性质。在同一本著作中,高斯还叙述了一种通过系数之间加减来求解多元一次方程组的方法,也就是现在的高斯消元法[55]。
进入十九世纪后,行列式理论进一步得到发展和完善。奧古斯丁·路易·柯西在1812年首先将“determinant”一词用来表示十八世纪出现的行列式,此前高斯只不过将这个词限定在二次曲线所对应的系数行列式中。柯西也是最早将行列式排成方阵并将其元素用双重下标表示的数学家(垂直线记法是阿瑟·凯莱在1841年率先使用的)[66]。柯西还证明了行列式的乘法定理(实际上是矩阵乘法),这个定理曾经在雅克·菲利普·玛利·比内(Jacque Philippe Marie Binet)的书中出现过,但没有证明[67][55][66]。
十九世纪五十年代,凯莱和詹姆斯·约瑟夫·西尔维斯特将矩阵的概念引入数学研究中[68]。行列式和矩阵之间的密切关系使得矩阵论蓬勃发展的同时也带来了许多关于行列式的新结果,例如阿达马不等式、正交行列式、对称行列式等等[69]。
与此同时,行列式也被应用于各种领域中。高斯在二次曲线和二次型的研究中使用行列式作为二次曲线和二次型划归为标准型时的判别依据。之后,卡尔·魏尔斯特拉斯和西尔维斯特又完善了二次型理论,研究了-矩阵的行列式以及初等因子[70][71]。行列式被用于多重函数的积分大约始于十九世纪三十年代。1832年至1833年间卡尔·雅可比发现了一些特殊结果,1839年,欧仁·夏尔·卡塔兰(Eugène Charles Catalan)发现了所谓的雅可比行列式[72][73]。1841年,雅可比发表了一篇关于函数行列式的论文,讨论函数的线性相关性与雅可比行列式的关系[74]。
行列式的一个主要应用是解线性方程组。当线性方程组的方程个数与未知数个数相等时,方程组不一定总是有唯一解。对一个有n个方程和n个未知数的线性方程组,我们研究未知数系数所对应的行列式。这个线性方程组有唯一解当且仅当它对应的行列式不为零。这也是行列式概念出现的根源[75]。
当线性方程组对应的行列式不为零时,由克萊姆法則,可以直接以行列式的形式写出方程组的解。但用克萊姆法則求解计算量巨大,因此并没有实际应用价值,一般用于理论上的推导[76]。
矩阵的概念出现得比行列式晚,直到十九世纪中期才被引入,然而两者在本质上仍然有密切关系。通过矩阵,线性方程组可以表示为
其中是由方程组中未知数的系数构成的方块矩阵,是未知数,而。
在矩阵理论中,行列式也有各种用途。多項式称为方块矩陣的特徵值多項式。这是一个由行列式定义的多项式,它的解是矩阵所有的特征值。换句话说,是矩阵的特征值当且仅当不是可逆矩阵。特征值多项式在矩阵理论中有重要的应用[77]。
早在高斯的时代,行列式就和多项式的研究联系在一起。行列式的一个应用是在所谓的“结式”上。结式是两个多项式和的西尔维斯特矩阵的行列式。两个多项式的结式等于0当且仅当它们有高于或等于一次的公因子多项式。结式还可以判断多项式是否有重根:如果多项式和它的微分多项式的结式不为零,那么这个多项式没有重根,否则有重根[78]。
行列式在多项式逼近理论中也有出现。给定一组插值点,判别插值多项式的存在性需要看所谓的范德蒙矩阵,而由于范德蒙矩阵的行列式不为零,因此根据克莱姆法则,插值多项式唯一存在(次数小于插值点个数)[79]。
朗斯基行列式是函数矩阵的行列式,因此本身也是一个函数。给定n个n-1次连续可微函数,f1、...、fn,它们的朗斯基行列式W(f1, ..., fn)为:
可以证明,如果f1、...、fn线性相关,那么它们的朗斯基行列式恒等于零[80]。
在线性微分动力系统理论中,朗斯基行列式用来判别若干个解的线性相关性。如果n个解f1、...、fn线性无关,那么它们的朗斯基行列式将总不为零[81]。根据刘维尔定理,n维空间上的线性微分方程:
的基础解系所构成的朗斯基行列式满足:
同样地,线性微分方程: 的基础解系所构成的朗斯基行列式满足:
行列式体现了线性变换对于空间体积的作用,对于非线性的函数,其对体积的影响更为复杂,但对于足够“良好”的函数,在一个微小的范围内,比如说在空间中一点的附近,可以将函数的效果近似地用线性的变换来代替。由此,对于某些函数,也可以将它在某一点附近的作用效果用它在这一点上的偏导数构成的矩阵(称为雅可比矩阵)来表示。这类行列式被称为“雅可比行列式”,即是雅可比矩阵的行列式,只对连续可微的函数有定义[82]。
在计算“体积”的多重积分中,雅可比行列式应用于换元积分的时候。积分的思想是将空间割成许多个微小的体积元,称为积分元素,再将每个体积元上的函数值乘以体积元的体积后相加。将一个积分元素换为另一个积分元素时,实际上作了一次对空间中体积的度量方式的改变:分划体积元的方式不同了。譬如在二维空间中,将直角坐标积分换为极坐标积分时,面积元素由方块区域变成扇形区域。因此,要测量这种体积度量方式的改变,可以将这种变换看成一个非线性的变换函数(实际上是一个微分同胚):。而它在每一点的影响可以通过雅可比行列式来体现[83]。
运用雅可比行列式的还有非线性方程组的数值求解。对于一般的非线性方程组,不存在求解公式,只能够用数值分析的方法求近似解。求近似解的基本思想也是将非线性问题在局部的地方逐步线性化,化归为线性方程组来求解。设有方程组:
其中是连续可微函数,并在解的附近雅可比行列式不为零,那么可以用牛顿法迭代求得近似解。迭代程序为:
其中的是第次迭代时的解的近似数值。每次迭代时先求解关于线性方程组
然后计算新的近似值
在实际应用中,还需要考虑带有参数的非线性方程组:
其中的可以代表温度、外力等环境因素。当环境改变时,方程解上的雅可比行列式可能从非零变为零。雅可比行列式为零的点称为临界点或分支点,是方程的解改变性质的地方。和线性方程组类似,当雅可比行列式的值为零时,方程组会出现局部多值的情况。寻找分支点和分支方向的研究是非线性方程求解的一大问题。[85]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.