QR分解 - Wikiwand

QR分解法是一种将矩阵分解的方式。这种方式，把矩阵分解成一个正交矩阵与一个上三角矩阵的积。QR分解经常用来解线性最小二乘法问题。QR分解也是特定特征值算法即QR算法的基础。

事实速览 线性代数, 向量 ...

\mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}

向量 · 向量空间 · 基底 · 行列式 · 矩阵

向量
标量 · 向量 · 向量空间 · 向量投影 · 外积（向量积 · 七维向量积） · 内积（数量积） · 二重向量

矩阵与行列式

矩阵 · 行列式 · 线性方程组 · 秩 · 核 · 迹 · 单位矩阵 · 初等矩阵 · 方块矩阵 · 分块矩阵 · 三角矩阵 · 非奇异方阵 · 转置矩阵 · 逆矩阵 · 对角矩阵 · 可对角化矩阵 · 对称矩阵 · 反对称矩阵 · 正交矩阵 · 幺正矩阵 · 埃尔米特矩阵 · 反埃尔米特矩阵 · 正规矩阵 · 伴随矩阵 · 余因子矩阵 · 共轭转置 · 正定矩阵 · 幂零矩阵 · 矩阵分解（LU分解 · 奇异值分解 · QR分解 · 极分解 · 特征分解） · 子式和余子式 · 拉普拉斯展开 · 克罗内克积

线性空间与线性变换
线性空间 · 线性变换 · 线性子空间 · 线性生成空间 · 基 · 线性映射 · 线性投影 · 线性无关 · 线性组合 · 线性泛函 · 行空间与列空间 · 对偶空间 · 正交 · 特征向量 · 最小二乘法 · 格拉姆-施密特正交化

关闭

类别及定义

方阵

任何方块矩阵A都可以分解为

A=QR

其中Q是正交矩阵（意味着Q^TQ = I）而R是上三角矩阵。如果A是非奇异的，且限定R的对角线元素为正，则这个因数分解是唯一的。

更一般的说，我们可以因数分解复数 $m$ × $n$ 矩阵（有着m ≥ n）为 $m$ × $n$ 幺正矩阵（在Q^∗Q = I 的意义上，不需要是方阵）和 $n$ × $n$ 上三角矩阵的乘积。对m<n的情况，在Q是 $m$ × $m$ 方阵，而R则是 $m$ × $n$ 矩阵。

长方形矩阵

更一般地，我们可以将m×n的A矩阵，其中m ≥ n，分解成m×m酉矩阵Q和m×n三角矩阵R的乘积。由于m×n上三角矩阵的底部(m−n)行完全由零组成，因此对R或R和Q进行分解通常很有用：

A=QR=Q{\begin{bmatrix}R_{1}\\0\end{bmatrix}}={\begin{bmatrix}Q_{1}&Q_{2}\end{bmatrix}}{\begin{bmatrix}R_{1}\\0\end{bmatrix}}=Q_{1}R_{1},

其中R₁是n×n上三角矩阵，0是(m − n)×n零矩阵，Q₁是m×n，Q₂是m×(m − n)，且Q₁和Q₂都是有正交列。

已隐藏部分未翻译内容，欢迎参与翻译。

Golub & Van Loan (1996，§5.2) call Q₁R₁ the thin QR factorization of A; Trefethen and Bau call this the reduced QR factorization.^[1] If A is of full rank n and we require that the diagonal elements of R₁ are positive then R₁ and Q₁ are unique, but in general Q₂ is not. R₁ is then equal to the upper triangular factor of the Cholesky decomposition of A* A (= A^TA if A is real).

QL、RQ 和 LQ 分解

类似的，我们可以定义A的QL，RQ和LQ分解。其中L是下三角矩阵。

QR分解的求法

QR分解的实际计算有很多方法，例如Givens旋转、Householder变换，以及Gram-Schmidt正交化等等。每一种方法都有其优点和不足。

使用Householder变换

Householder变换

Householder变换将一个向量关于某个平面或者超平面进行反射。我们可以利用这个操作对 $m\times n(m\geqq n)$ 的矩阵 $A$ 进行QR分解。

矩阵 $Q$ 可以被用于对一个向量以一种特定的方式进行反射变换，使得它除了一个维度以外的其他所有分量都化为0。

令 $\mathbf {x}$ 为矩阵 $A$ 的任一m维实列向量，且有 $\|\mathbf {x} \|=|\alpha |$ （其中 $\alpha$ 为标量）。若该算法是通过浮点数实现的，则 $\alpha$ 应当取和 $\mathbf {x}$ 的第 $k$ 维相反的符号（其中 $x_{k}$ 是要保留不为0的项），这样做可以避免精度缺失。对于复数的情况，令

\alpha =-\mathrm {e} ^{\mathrm {i} \arg x_{k}}\|\mathbf {x} \|

(Stoer & Bulirsch 2002，第225页)，并且在接下来矩阵 $Q$ 的构造中要将矩阵转置替换为共轭转置。

接下来，设 $\mathbf {e} _{1}$ 为单位向量 $(1,0,\cdots ,0)^{T}$ ，||·||为欧几里德范数， $I$ 为 $m\times m$ 单位矩阵，令

\mathbf {u} =\mathbf {x} -\alpha \mathbf {e} _{1}

，

\mathbf {v} ={\mathbf {u}  \over \|\mathbf {u} \|}

，

Q=I-2\mathbf {v} \mathbf {v} ^{T}

。

或者，若 $A$ 为复矩阵，则

Q=I-(1+w)\mathbf {v} \mathbf {v} ^{H}

，其中

w=\mathbf {x} ^{H}\mathbf {v} \mathbf {/} \mathbf {v} ^{H}\mathbf {x}

式中

\mathbf {x} ^{H}

是

x

的共轭转置（亦称埃尔米特共轭或埃尔米特转置）。

则 $Q$ 为一个 $m\times m$ 的Householder矩阵，它满足

Q\mathbf {x} =(\alpha ,0,\cdots ,0)^{T}\

利用Householder矩阵，可以将一个 $m\times n$ 的矩阵 $A'$ 变换为上三角矩阵。首先，我们将A左乘通过选取矩阵的第一列得到列向量 $x$ 的Householder矩阵 $Q_{1}$ 。这样，我们得到的矩阵 $Q_{1}A$ 的第一列将全部为0（第一行除外）：

Q_{1}A={\begin{bmatrix}\alpha _{1}&\star &\dots &\star \\0&&&\\\vdots &&A'&\\0&&&\end{bmatrix}}

这个过程对于矩阵 $A'$ （即 $Q_{1}A$ 排除第一行和第一列之后剩下的方阵）还可以继续做下去，从而得到另一个Householder矩阵 $Q_{2}$ 。注意到 $Q_{2}$ 其实比 $Q_{1}$ 要小，因为它是在 $Q_{1}A$ 而非 $A$ 的基础上得到的。因此，我们需要在 $Q_{2}$ 的左上角补上1，或者，更一般地来说：

Q_{k}={\begin{bmatrix}I_{k-1}&0\\0&Q_{k}'\end{bmatrix}}

将这个迭代过程进行 $t$ 次之后（ $t=\min(m-1,n)$ ）,将有

R=Q_{t}\cdots Q_{2}Q_{1}A

其中R为一个上三角矩阵。因此，令

Q=Q_{1}^{T}Q_{2}^{T}\cdots Q_{t}^{T},

则 $A=QR$ 为矩阵 $A$ 的一个QR分解。

相比与Gram-Schmidt正交化，使用Householder变换具有更好的数值稳定性。

例子

现在要用Householder变换求解矩阵 $A$ 的 $QR$ 分解。

A={\begin{bmatrix}0&3&1\\0&4&-2\\2&1&1\\\end{bmatrix}}

因为 $\alpha _{1}=[0,\ 0,\ 2]^{T}$ , 令 $a_{1}=||\alpha _{1}||_{2}=2$ ，则

\omega _{1}={\frac {\alpha _{1}-a_{1}e_{1}}{||\alpha _{1}-a_{1}e_{1}||_{2}}}={\frac {1}{\sqrt {2}}}[-1,\ 0,\ 1]^{T}

则有

H_{1}=I-2\omega _{1}\omega _{1}^{H}={\begin{bmatrix}0&0&1\\0&1&0\\1&0&0\\\end{bmatrix}}

从而，

H_{1}A={\begin{bmatrix}2&1&1\\0&4&-2\\0&3&1\\\end{bmatrix}}

记 $\beta =[4,\ 3]^{T}$ , 则 $b_{1}=||\beta _{2}||_{2}=5$ 。令

\omega _{2}={\frac {\beta _{2}-b_{1}e_{1}}{||\beta _{2}-b_{1}e_{1}||_{2}}}={\frac {1}{\sqrt {10}}}[-1,\ 3]^{T}

{\hat {H_{2}}}=I-2\omega _{2}\omega ^{H}={\frac {1}{5}}{\begin{bmatrix}4&3\\3&-4\\\end{bmatrix}}

记，

H_{2}={\begin{bmatrix}1&0^{T}\\0&{\hat {H_{2}}}\\\end{bmatrix}}={\begin{bmatrix}1&0&0\\0&{\frac {4}{5}}&{\frac {3}{5}}\\0&{\frac {3}{5}}&-{\frac {4}{5}}\\\end{bmatrix}}

则，

R=H_{2}(H_{1}A)={\begin{bmatrix}2&1&1\\0&5&-1\\0&0&-2\\\end{bmatrix}}

那么

Q=H_{1}H_{2}={\frac {1}{5}}{\begin{bmatrix}0&3&-4\\0&4&3\\5&0&0\\\end{bmatrix}}

使用吉文斯旋转

吉文斯旋转

吉文斯旋转表示为如下形式的矩阵

G(i,j,\theta )={\begin{bmatrix}1&\cdots &0&\cdots &0&\cdots &0\\\vdots &\ddots &\vdots &&\vdots &&\vdots \\0&\cdots &c&\cdots &-s&\cdots &0\\\vdots &&\vdots &\ddots &\vdots &&\vdots \\0&\cdots &s&\cdots &c&\cdots &0\\\vdots &&\vdots &&\vdots &\ddots &\vdots \\0&\cdots &0&\cdots &0&\cdots &1\end{bmatrix}}

这里的 c = cos(θ) 和 s = sin(θ) 出现在第 i 行和第 j 行与第 i 列和第 j 列的交叉点上。就是说，吉文斯旋转矩阵的所有非零元定义如下：:

{\begin{aligned}g_{k\,k}&{}=1\qquad {\text{for}}\ k\neq i,\,j\\g_{i\,i}&{}=c\\g_{j\,j}&{}=c\\g_{i\,j}&{}=s\\g_{j\,i}&{}=-s\end{aligned}}

乘积 $G (i, j, θ) x$ 表示向量 x 在 (i,j)平面中的逆时针旋转 θ 弧度。

吉文斯旋转作用于QR分解

对于一个向量

{\begin{array}{lcl}A&=&{\begin{bmatrix}a\\b\\\end{bmatrix}}\\\end{array}}

如果， $r={\sqrt {a^{2}+b^{2}}}$ , $c={\frac {a}{r}}$ , $s=-{\frac {b}{r}}$ , 那么，就存在旋转矩阵G，使 $A$ 底部转成0。

A_{2\_Sub}={\begin{bmatrix}c&-s\\s&c\\\end{bmatrix}}{\begin{bmatrix}a\\b\\\end{bmatrix}}={\begin{bmatrix}r\\0\\\end{bmatrix}}

每一次的旋转，吉文斯旋转都可以将一个元素化成0，直到将原始矩阵转成一个上三角矩阵，则完成分解。

A=QR

Q=G_{1}^{T}G_{2}^{T}\cdots G_{k}^{T}

例子

A_{1}={\begin{bmatrix}6&5&0\\5&1&4\\0&4&3\\\end{bmatrix}}

r={\sqrt {6^{2}+5^{2}}}\approx 7.8102

c=6/r\approx 0.7682

s=-5/r\approx -0.6402

A_{2}=G_{1}A_{1}={\begin{bmatrix}c&-s&0\\s&c&0\\0&0&1\\\end{bmatrix}}{\begin{bmatrix}6&5&0\\5&1&4\\0&4&3\\\end{bmatrix}}\approx {\begin{bmatrix}7.8102&4.4813&2.5607\\0&-2.4327&3.0729\\0&4&3\\\end{bmatrix}}

对于: $A_{2}$ 子矩阵 : $A_{2\_Sub}$

A_{2\_Sub}={\begin{bmatrix}-2.4327&3.0729\\4&3\\\end{bmatrix}}

r={\sqrt {(-2.4327)^{2}+4^{2}}}\approx 4.6817

c=-2.4327/r\approx -0.5196

s=-5/r\approx -0.8544

G_{2}A_{2}={\begin{bmatrix}1&0&0\\0&c&-s\\0&s&c\\\end{bmatrix}}{\begin{bmatrix}7.8102&4.4813&2.5607\\0&-2.4327&3.0729\\0&4&3\\\end{bmatrix}}\approx {\begin{bmatrix}7.8102&4.4813&2.5607\\0&4.6817&0.9664\\0&0&-4.1843\\\end{bmatrix}}

R=G_{2}A_{2}=G_{2}G_{1}A_{1}

Q=G_{1}^{T}G_{2}^{T}={\begin{bmatrix}0.7682&0.3327&0.5470\\0.6402&-0.3992&-0.6564\\0&0.8544&-0.5196\\\end{bmatrix}}

使用格拉姆-施密特正交化方法

基本思想

Thumb — 图1 ${\boldsymbol {v}}$ 在 ${\boldsymbol {V}}^{2}$ 上投影，构造 ${\boldsymbol {V}}^{3}$ 上的正交基 ${\boldsymbol {\beta }}$

格拉姆-施密特正交化的基本想法，是利用投影原理在已有正交基的基础上构造一个新的正交基。

设 ${\boldsymbol {v}}\in {\boldsymbol {V^{n}}}$ 。 ${\boldsymbol {V}}^{k}$ 是 ${\boldsymbol {V}}^{n}$ 上的 $k$ 维子空间，其标准正交基为 $\{{\boldsymbol {\eta }}_{1},\ldots ,{\boldsymbol {\eta }}_{k}\}$ ，且 ${\boldsymbol {v}}$ 不在 ${\boldsymbol {V}}^{k}$ 上。由投影原理知， ${\boldsymbol {v}}$ 与其在 ${\boldsymbol {V}}^{k}$ 上的投影 $\mathrm {proj} _{\boldsymbol {V^{k}}}{\boldsymbol {v}}$ 之差

{\boldsymbol {\beta }}={\boldsymbol {v}}-\sum _{i=1}^{k}\mathrm {proj} _{{\boldsymbol {\eta }}_{i}}\,{\boldsymbol {v}}={\boldsymbol {v}}-\sum _{i=1}^{k}\langle {\boldsymbol {v}},{\boldsymbol {\eta }}_{i}\rangle {\boldsymbol {\eta }}_{i}

是正交于子空间 ${\boldsymbol {V}}^{k}$ 的，亦即 ${\boldsymbol {\beta }}$ 正交于 ${\boldsymbol {V}}^{k}$ 的正交基 ${\boldsymbol {\eta }}_{i}$ 。因此只要将 ${\boldsymbol {\beta }}$ 单位化，即

{\boldsymbol {\eta }}_{k+1}={\frac {\boldsymbol {\beta }}{\|{\boldsymbol {\beta }}\|}}={\frac {\boldsymbol {\beta }}{\sqrt {\langle {\boldsymbol {\beta }},{\boldsymbol {\beta }}\rangle }}}

那么 $\{{\boldsymbol {\eta }}_{1},\ldots ,{\boldsymbol {\eta }}_{k},{\boldsymbol {\eta }}_{k+1}\}$ 就是 ${\boldsymbol {V}}^{k}$ 在 ${\boldsymbol {v}}$ 上扩展的子空间 $\mathrm {span} \{{\boldsymbol {v}},{\boldsymbol {\eta }}_{1},...,{\boldsymbol {\eta }}_{k}\}$ 的标准正交基。

根据上述分析，对于向量组 $\{{\boldsymbol {v}}_{1},\ldots ,{\boldsymbol {v}}_{m}\}$ 张成的空间 ${\boldsymbol {V}}^{m}$ ( $m<n$ )，只要从其中一个向量（不妨设为 ${\boldsymbol {v}}_{1}$ ）所张成的一维子空间 $\mathrm {span} \{{\boldsymbol {v}}_{1}\}$ 开始（注意到 ${\boldsymbol {v}}_{1}$ 就是 $\mathrm {span} \{{\boldsymbol {v}}_{1}\}$ 的正交基），重复上述扩展构造正交基的过程，就能够得到 ${\boldsymbol {V}}^{n}$ 的一组正交基。这就是格拉姆-施密特正交化。

格拉姆-施密特正交化算法

首先需要确定已有基底向量的顺序，不妨设为 $\{{\boldsymbol {v}}_{1},\ldots ,{\boldsymbol {v}}_{n}\}$ 。Gram-Schmidt正交化的过程如下：

	${\boldsymbol {\beta }}_{1}={\boldsymbol {v}}_{1},$		${\boldsymbol {\eta }}_{1}={{\boldsymbol {\beta }}_{1} \over \\|{\boldsymbol {\beta }}_{1}\\|}$
	${\boldsymbol {\beta }}_{2}={\boldsymbol {v}}_{2}-\langle {\boldsymbol {v}}_{2},{\boldsymbol {\eta }}_{1}\rangle {\boldsymbol {\eta }}_{1},$		${\boldsymbol {\eta }}_{2}={{\boldsymbol {\beta }}_{2} \over \\|{\boldsymbol {\beta }}_{2}\\|}$
	${\boldsymbol {\beta }}_{3}={\boldsymbol {v}}_{3}-\langle {\boldsymbol {v}}_{3},{\boldsymbol {\eta }}_{1}\rangle {\boldsymbol {\eta }}_{1}-\langle {\boldsymbol {v}}_{3},{\boldsymbol {\eta }}_{2}\rangle {\boldsymbol {\eta }}_{2},$		${\boldsymbol {\eta }}_{3}={{\boldsymbol {\beta }}_{3} \over \\|{\boldsymbol {\beta }}_{3}\\|}$
	$\vdots$		$\vdots$
	${\boldsymbol {\beta }}_{n}={\boldsymbol {v}}_{n}-\sum _{i=1}^{n-1}\langle {\boldsymbol {v}}_{n},{\boldsymbol {\eta }}_{i}\rangle {\boldsymbol {\eta }}_{i},$		${\boldsymbol {\eta }}_{n}={{\boldsymbol {\beta }}_{n} \over \\|{\boldsymbol {\beta }}_{n}\\|}$

这样就得到 $\mathrm {span} \{{\boldsymbol {v}}_{1},\ldots ,{\boldsymbol {v}}_{n}\}$ 上的一组正交基 $\{{\boldsymbol {\beta }}_{1},\ldots ,{\boldsymbol {\beta }}_{n}\}$ ，以及相应的标准正交基 $\{{\boldsymbol {\eta }}_{1},\ldots ,{\boldsymbol {\eta }}_{n}\}$ 。

例子

现在要用格拉姆-施密特变换求解矩阵 $A$ 的 $QR$ 分解。

A={\begin{bmatrix}1&2&4\\0&0&5\\0&3&6\\\end{bmatrix}}

令， $a=[1,0,0]$

q_{1}={\frac {a}{||a||}}={\begin{bmatrix}1\\0\\0\\\end{bmatrix}}

{\hat {q_{2}}}=b-(b*q_{1})q_{1}={\begin{bmatrix}2\\0\\3\\\end{bmatrix}}-2{\begin{bmatrix}1\\0\\0\\\end{bmatrix}}={\begin{bmatrix}0\\0\\3\\\end{bmatrix}}

q_{2}={\frac {\hat {q_{2}}}{||{\hat {q_{2}}}||}}={\begin{bmatrix}0\\0\\1\\\end{bmatrix}}

{\hat {q_{3}}}=c-(c*q_{1})q_{1}-(c*q_{2})q_{2}={\begin{bmatrix}4\\5\\6\\\end{bmatrix}}-4{\begin{bmatrix}1\\0\\0\\\end{bmatrix}}-6{\begin{bmatrix}0\\0\\1\\\end{bmatrix}}={\begin{bmatrix}0\\5\\0\\\end{bmatrix}}

q_{3}={\frac {\hat {q_{3}}}{||{\hat {q_{3}}}||}}={\begin{bmatrix}0\\1\\0\\\end{bmatrix}}

那么可知，

Q={\begin{bmatrix}1&0&0\\0&0&1\\0&1&0\\\end{bmatrix}}

由 $A=QR$ ，可知，

R={\begin{bmatrix}1&2&4\\0&3&6\\0&0&5\\\end{bmatrix}}

Matlab

MATLAB以qr函数来执行QR分解法，其语法为

[Q,R]=qr(A)

其中Q代表正规正交矩阵，

而R代表上三角形矩阵。

此外，原矩阵A不必为正方矩阵；如果矩阵A大小为 $m\times n$ ，则矩阵Q大小为 $m\times m$ ，矩阵R大小为 $m\times n$ 。

用途

解线性方程组

对于直接求解线性方程组的逆，用QR分解的方法求解会更具有数据的稳定性。对于求解一个线性系统 $Ax=b$ , 这里 $A$ 的维度是 $m\times n$ 。

如果 $m\leq n$ , 那么 $A^{T}=QR$ ,这里 $Q^{T}=Q^{-1}$ )。

$R$ 的形式是 $R={\begin{bmatrix}R_{1}\\0\end{bmatrix}}$ ， $R_{1}$ 是 $R$ 上不为0的部分。那么对于

x=Q{\begin{bmatrix}\left(R_{1}^{\textsf {T}}\right)^{-1}b\\0\end{bmatrix}}

如果 $m>n$ , 那么 $A=QR$ ,这里 $Q^{T}=Q^{-1}$ )。本质是最小化 $||A{\hat {x}}-b||$

{\hat {x}}=R_{1}^{-1}\left(Q_{1}^{\textsf {T}}b\right)

参考文献

[1]
Trefethen, Lloyd N.; Bau, David III. Numerical linear algebra. Philadelphia, PA: Society for Industrial and Applied Mathematics. 1997. ISBN 978-0-898713-61-9.

外部链接

MIT. QR Decomposition. Youtube. [2020-07-01]. （原始内容存档于2020-07-27）.
Poujh. QR Decomposition Givens旋转. Youtube. [2020-07-01]. （原始内容存档于2020-09-01）.

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.

Wikiwand for Chrome

Wikiwand for Edge

Wikiwand for Firefox