특잇값 분해(Singular Value Decomposition, SVD)는 행렬을 특정한 구조로 분해하는 방식으로, 신호 처리와 통계학 등의 분야에서 자주 사용된다.
특잇값 분해는 행렬의 스펙트럼 이론을 임의의 직사각행렬에 대해 일반화한 것으로 볼 수 있다. 스펙트럼 이론을 이용하면 직교 정사각행렬을 고윳값을 기저로 하여 대각행렬로 분해할 수 있다.
실수나 복소수로 이루어진 체 K의 원소로 구성되는 m × n 행렬 M에 대해, M은 다음과 같은 세 행렬의 곱으로 분해할 수 있다.
여기에서 각 행렬은 다음과 같은 성질을 가진다.
- 는 m × m 크기를 가지는 유니터리 행렬이다.
- 는 m × n 크기를 가지며, 대각선상에 있는 원소의 값은 음수가 아니며 나머지 원소의 값이 모두 0인 대각행렬이다.
- 는 V의 켤레전치 행렬로, n × n 유니터리 행렬이다.
행렬 M을 이와 같은 세 행렬의 곱으로 나타내는 것을 M의 특잇값 분해라고 한다.
일반적으로 Σ 행렬은 더 큰 값이 먼저 나오도록, 즉 이 되도록 구하며, 이렇게 할 경우 Σ는 M에 따라 유일하게 결정된다.
다음과 같은 행렬 가 있을 때,
이 행렬을 로 분해하면 다음과 같다.
여기에서 특잇값 분해 결과는 유일하지 않다. 예를 들어, 위의 결과에서 를
로 교체할 수도 있다.
m × n 행렬 M에 대해 다음 두 조건을 만족하는 벡터 과 이 존재할 때, 음수가 아닌 실수 σ를 특잇값이라 부른다.
또한 u와 v를 각각 좌측 특이벡터와 우측 특이벡터라 부른다.
특잇값 분해 에서 Σ의 대각선 성분들은 M의 특잇값이 되고 U와 V의 열들은 각각의 특잇값에 해당하는 좌측 특이벡터와 우측 특이벡터가 된다. 또한 위 식으로부터 다음과 같은 사실도 알 수 있다.
- m × n 행렬 M은 최소한 한개, 최대 p = min(m, n)개의 서로 다른 특잇값을 갖는다.
- M의 좌측 특이벡터들을 포함하는, Km의 유니터리 기저를 항상 찾을 수 있다.
- M의 우측 특이벡터들을 포함하는, Kn의 유니터리 기저를 항상 찾을 수 있다.
특잇값 분해는 정사각행렬만을 분해할 수 있는 고윳값 분해보다 훨씬 일반적인 행렬을 다룰 수 있지만, 두 분해는 서로 관련되어 있다.
M이 양의 정부호인 에르미트 행렬일 때 M의 모든 고윳값은 음이 아닌 실수이다. 이때 M의 특잇값과 특이벡터는 M의 고윳값과 고유벡터와 같아진다.
더 일반적으로는, M의 특잇값 분해가 주어졌을 때 다음과 같은 두 식이 성립한다.
두 식의 우변은 좌변의 고윳값 분해를 나타낸다. 즉, M의 0이 아닌 특잇값들의 제곱은 M*M 과 MM*의 고윳값들과 같다. 또한 U는 MM*의 고유벡터이고 V는 M*M의 고유벡터이다.