W matematyce macierz to układ liczb, symboli lub wyrażeń zapisanych w postaci prostokątnej tablicy[1].
W algebrze liniowej macierze wprowadza się często jako sposób skondensowanego zapisu układów równań liniowych, co ma na celu wyeliminowanie powtarzających się elementów standardowej notacji układów równań tego rodzaju z wieloma niewiadomymi[uwaga 1]. Macierze pozwalają również na reprezentowanie przekształceń liniowych, czy form dwuliniowych w sposób umożliwiający przeprowadzanie obliczeń. Ponieważ wiele przekształceń geometrycznych (jak na przykład obroty przestrzeni wokół początku układu współrzędnych) są przekształceniami liniowymi, macierze znajdują zastosowanie w geometrii analitycznej i grafice komputerowej[uwaga 2].
Przykładami macierzy reprezentujących przekształcenia liniowe są pojawiające się w analizie wielowymiarowej macierze Jacobiego. Przykładami macierzy reprezentujących formy dwuliniowe są macierze Hessego w analizie wielowymiarowej oraz macierze kowariancji w rachunku prawdopodobieństwa i statystyce. Przykładem macierzy której wprowadzenie nie jest motywowane reprezentowaniem żadnego naturalnego przekształcenia liniowego, czy formy kwadratowej jest macierz incydencji w teorii grafów[uwaga 3].
Oprócz wymienionych powyżej dziedzin macierze są wykorzystywane także w teorii reprezentacji, kryptografii, czy elektronice – część z tych użyć omówiono w Zastosowaniach. Macierze bada się również niezależnie od jakichkolwiek zastosowań w ramach algebry liniowej i teorii macierzy.
Elementy z których złożona jest macierz nazywamy współczynnikami macierzy. Aby zdefiniować operacje na macierzach takie jak suma dwóch macierzy lub iloczyn dwóch macierzy należy założyć, że współczynniki rozważanych macierzy należą do pewnego pierścienia. Popularnym mocniejszym założeniem jest wymaganie, by współczynniki macierzy należały do pewnego ciała. Jeszcze mocniejszym założeniem (niewymagającym znajomości abstrakcyjnego pojęcia ciała) jest przyjęcie, że zbiór dozwolonych współczynników jest (w zależności od potrzeb):
- liczbami wymiernymi
- liczbami rzeczywistymi lub
- liczbami zespolonymi
- W artykule zakłada się, że wszystkie macierze mają współczynniki z ustalonego ciała o ile nie zaznaczono inaczej.
Wprowadzenie i oznaczenia
Poziomy układ elementów znajdujących się w jednej linii nazywa się wierszem, a pionowy – kolumną macierzy. Dane wpisane w macierz nazywa się jej elementami, współczynnikami lub wyrazami; każdy element można jednoznacznie zidentyfikować, podając jego wskaźniki lub indeksy – zwykle w tej kolejności: numer wiersza i kolumny macierzy, w której stoi. Para złożona z liczby wierszy i kolumn nazywana jest typem macierzy – często liczby te oddziela się znakiem Wyrazy macierzy otacza się przeważnie nawiasami okrągłymi[2] lub kwadratowymi (w starszych pozycjach można znaleźć podwójne kreski[3], co dziś może być źródłem pomyłek, np. z wartością bezwzględną wyznacznika bądź normą macierzy; zob. Ujęcie algebraiczne i uogólnienia); stąd napisy
oznaczają te same macierze – w dalszej części artykułu stosowane będą nawiasy kwadratowe. W ten sposób powyższa macierz złożona jest z 4 wierszy i 3 kolumn, tzn. jest typu Liczba występuje w tej macierzy dwukrotnie: na przecięciu pierwszego wiersza i pierwszej kolumny oraz na przecięciu trzeciego wiersza i drugiej kolumny – innymi słowy element macierzy o wskaźnikach lub to Ostatnia (trzecia) kolumna składa się z elementów w tej właśnie kolejności.
Nie ma ogólnie przyjętej metody oznaczania macierzy, przy czym trendy podlegały zmianom w czasie. Sposób oznaczania typu nie jest ustalony – zwykle bywa zapisywany oddzielnie (jak w tym artykule). W artykule przyjęto konwencję stosowania tych samych liter alfabetu łacińskiego na oznaczenie macierzy i jej elementów – dużych (pogrubionych, prostych) do oznaczenia macierzy i małych (pochylonych), o ile są skalarami, ze wskaźnikami w indeksie dolnym (zwykle, choć spotyka się oznaczenia ze wskaźnikami w indeksie górnym albo po jednym w każdym z indeksów; wśród innych sposobów zapisu można wymienić również notację funkcyjną, zob. Definicja) na oznaczenie jej elementów. Tak więc elementy macierzy oznaczonej literą będą zapisywane symbolicznie jako gdzie jest wskaźnikiem elementu leżącego na przecięciu -tego wiersza i -tej kolumny, lub jeśli nie wprowadza to niejasności, lub po prostu – taki element (współczynnik, wyraz) nazywa ogólnym. Macierz złożoną z elementów oznacza się, otaczając wyraz ogólny nawiasami okrągłymi, lub (jak w tym artykule) kwadratowymi, W ten sposób macierz będzie oznaczana tzn.
Macierz o liczbie kolumn równej liczbie wierszy nazywa się kwadratową – wspomnianą wspólną liczbę kolumn i wierszy nazywa się wtedy stopniem tej macierzy; macierze niebędące kwadratowymi nazywa się dla wyróżnienia prostokątnymi. Jeśli macierz jest kwadratowa, to:
- ciąg elementów o równych wskaźnikach wiersza i kolumny począwszy od jeden do jej stopnia nazywa się główną przekątną (główną diagonalą lub często po prostu przekątną bądź diagonalą) macierzy kwadratowej;
- przekątne leżące nad lub pod główną przekątną nazywa się odpowiednio nadprzekątną lub podprzekątną macierzy;
- przekątną, której wiersz rośnie od pierwszego do ostatniego, a kolumna maleje od ostatniej do pierwszej nazywa czasem przeciwprzekątną lub antyprzekątną.
Pojęcia te uogólnia się niekiedy na dowolne macierze prostokątne.
Dla macierzy
stopnia jej główną przekątną jest ciąg elementów równych odpowiednio a antyprzekątną – ciąg złożony z elementów równych kolejno Jej nadprzekątną i podprzekątną tworzą odpowiednio pary elementów i równych kolejno oraz
Podmacierz danej macierzy to dowolny układ jej elementów powstały przez „skreślenie” pewnej liczby wierszy i kolumn sam tworzący macierz; w szczególności podmacierze (kwadratowe) zawierające kolejne wiersze i kolumny o tych samych wskaźnikach, poczynając od pierwszego, nazywa się podmacierzami głównymi; innymi słowy są to podmacierze kwadratowe zawierające pewną liczbę początkowych wyrazów głównej przekątnej. Macierz klatkowa to macierz, w której wprowadzono podział elementów na grupy kolejnych wierszy i kolumn – obrazowo czyni się to, prowadząc poziome i pionowe linie między wierszami i kolumnami macierzy, dzieląc ją na podmacierze nazywane klatkami. Podział ten umożliwia traktowanie macierzy klatkowej jako macierzy, której elementami są inne macierze (klatki); podobnie macierze klatkowe można zestawiać z „pasujących” macierzy.
Jeżeli dane są macierze: odpowiednio typów to można z nich zestawić macierz klatkową
Podstawowe działania
Macierze i uważa się za równe, jeśli mają ten sam typ i równe odpowiadające sobie elementy, tzn. dla każdej możliwej pary zachodzi
Sumę macierzy i definiuje się „po współczynnikach”, tzn. za pomocą wzoru
- dla wszystkich
Mnożenie przez skalar macierzy oraz liczby również definiuje się „po współczynnikach”, czyli
- dla dowolnych
Działanie mnożenia macierzy można określić na wiele sposobów[uwaga 4], najczęściej jednak „mnożenie macierzy” oznacza tzw. iloczyn Cauchy’ego macierzy (zob. przekształcenia liniowe): dla macierzy typu oraz typu dany jest on jako taka macierz typu oznaczana dla której
- dla dowolnych
Mnożenie to jest łączne, ale nie jest przemienne; ponadto jest ono obustronnie rozdzielne względem dodawania, a do tego zgodne z mnożeniem przez skalar.
Przestawienie bądź transpozycja danej macierzy tzn. zamiana jej kolumn i wierszy miejscami (z zachowaniem kolejności) pozwala na zwięzłe przedstawienie wielu jej własności; macierz transponowaną lub przestawioną względem macierzy definiuje się jako macierz
- dla wszystkich
przy czym oraz
Operacjami elementarnymi na macierzy nazywa się operacje: zamiany miejscami dwóch wierszy macierzy, pomnożenia jednego z wierszy przez liczbę różną od zera oraz dodania wiersza macierzy do innego jej wiersza. Macierz elementarna to macierz powstała z macierzy jednostkowej w wyniku jednej operacji elementarnej na jej wierszach[uwaga 5]. Podobnie definiuje się operacje elementarne na kolumnach danej macierzy.
Macierze prostokątne
Układy równań liniowych
Układ równań liniowych o zmiennych postaci
można zapisać w postaci równania macierzowego
dla danych macierzy nazywanej macierzą główną układu, oraz Macierz klatkową postaci nazywa się macierzą uzupełnioną lub rozszerzoną układu.
W celu uzyskania rozwiązania układy równań liniowych przekształca się za pomocą operacji elementarnych, które zachowują zbiór rozwiązań układu; odpowiadają im operacje elementarne na wierszach macierzy, których przykładanie można postrzegać jako mnożenie lewostronne macierzy uzupełnionych układu przez macierze elementarne (mnożenie prawostronne odpowiada operacjom elementarnym na kolumnach macierzy).
Przekształcenia liniowe
Każda macierz typu opisuje przekształcenie liniowe przestrzeni współrzędnych w odwzorowujące wektor w wektor Przekształceniu temu odpowiada mnożenie macierzy typu przez macierz typu o tych samych współczynnikach, co wektor dając w wyniku macierz typu o współczynnikach identycznych z tymi w wektorze Odwrotnie: każde przekształcenie liniowe zadaje macierz typu przy czym to -ta współrzędna wektora gdzie jest wektorem o współrzędnych równych zeru poza -tą współrzędną równą jedynce. Przekształcenie jest więc reprezentowane przez macierz zaś jest macierzą przekształcenia liniowego
W ten sposób układ równań liniowych można traktować jako problem opisu przekształcenia liniowego gdzie
- istnienie rozwiązań jest tożsame z istnieniem wektora spełniającego (czyli należeniem do obrazu ),
- jednoznaczność rozwiązań jest równoważna różnowartościowości przekształcenia (czyli trywialności jego jądra).
Podejście to tłumaczy często stosowane nazwy wektor zmiennych i wektor wyrazów wolnych odpowiednio macierzy i macierzy którym odpowiadają wektory oraz W ogólności macierze odpowiednio typu oraz (jednokolumnowe i jednowierszowe) nazywa się zwykle wektorami kolumnowymi i wektorami wierszowymi.
Przykładowo macierz rzeczywistą można postrzegać jako przekształcenie kwadratu jednostkowego w równoległobok o wierzchołkach Równoległobok na ilustracji obok otrzymano poprzez przemnożenie macierzy kolejno przez macierze co odpowiada przykładaniu przekształcenia do wektorów wskazujących wierzchołki kwadratu jednostkowego.
Powinowactwo względem osi poziomej o | Symetria względem osi pionowej | Przekształcenie ekwiafiniczne o | Jednokładność o skali | Obrót o kąt miary |
Tabela przedstawia macierze stopnia 2 z odpowiadającymi im przekształceniami płaszczyzny: niebieska kratka zawierająca pewien kształt jest przekształcana na zieloną; czarny punkt oznacza początek przestrzeni. |
Definicja standardowego mnożenia macierzy jest dobrana tak, by we wzajemnie jednoznacznej odpowiedniości przekształceń liniowych i macierzy składaniu pierwszych odpowiadało mnożenie drugich: jeśli przekształceniu odpowiada macierz typu to złożeniu odpowiada wtedy macierz typu gdyż działaniu odpowiada mnożenie macierzy
Z tego powodu macierz traktuje się zwykle jak odpowiadające mu przekształcenie liniowe a wektory utożsamia się z ich macierzami w związku z tym spotyka się często zapis oznaczający działanie przekształcenia liniowego na wektorze zapis jest nieco bardziej formalny zważywszy na własność liniowość przekształcenia.
Rzędem macierzy nazywa się rząd odpowiadającego jej przekształcenia liniowego czyli wymiar jego obrazu, tzn. największą liczbę liniowo niezależnych wierszy bądź kolumn macierzy (liczba niezależnych równań w układzie równań liniowych). Twierdzenie o rzędzie mówi, że suma wymiaru jądra i rzędu macierzy jest równa liczbie jej kolumn.
Macierze kwadratowe
Przekształcenie liniowe przestrzeni liniowej (albo dowolnej innej) w siebie nazywa się jej endomorfizmem liniowym; macierz endomorfizmu jest zawsze kwadratowa. Przestrzenie liniowe, które zawierają się w innych przestrzeniach liniowych, nazywa się ich podprzestrzeniami (liniowymi); przykładami podprzestrzeni dowolnej przestrzeni są podprzestrzeń niewłaściwa, czyli ona sama, oraz podprzestrzeń zerowa/trywialna, czyli zawierają wyłącznie wektor zerowy (por. przykłady przestrzeni liniowych). Można więc powiedzieć, że endomorfizm przekształca przestrzeń w pewną jej podprzestrzeń – jest to kluczowa, a zarazem znamienna własność tych przekształceń liniowych.
Macierzą diagonalną nazywa się macierz kwadratową, której wszystkie niezerowe elementy znajdują się wyłącznie na głównej przekątnej. Często zapisuje się ją jako gdzie jest jej stopniem. Macierze kwadratowe o elementach nad (odp. pod) przekątną główną równych zeru nazywa się dolnotrójkątnymi (odp. górnotrójkątnymi); macierze jednocześnie dolno- i górnotrójkątne są diagonalne. Macierz trójkątną mającą na głównej przekątnej jedynki nazywa się unitrójkątną. Śladem macierzy nazywa się sumę jej elementów na głównej przekątnej, przy czym oraz
Macierze postaci nazywa się macierzami skalarnymi. Macierz skalarną nazywa się macierzą jednostkową. Jeżeli
gdzie wszystkie powyższe macierze są kwadratowe ustalonego stopnia, to macierz jest wyznaczona jednoznacznie – nazywa się ją macierzą odwrotną do i oznacza symbolem o macierzy mówi się zaś wtedy, że jest odwracalna.
Wyznacznik
Wyznacznikiem lub macierzy kwadratowej nazywa się liczbę kodującą pewne właściwości przekształcenia reprezentowanego przez tę macierz: jego wartość bezwzględna jest równa (w ) polu powierzchni obrazu kwadratu jednostkowego, tzn. pewnego równoległoboku, lub (w ) objętości obrazu sześcianu jednostkowego, tzn. pewnego równoległościanu[uwaga 6], a znak mówi o orientacji przekształcenia – jest on dodatni wtedy i tylko wtedy, gdy przekształcenie zachowuje orientację[uwaga 7]; macierz o wyznaczniku jednostkowym reprezentuje przekształcenie równopolowe.
Macierz o zerowym wyznaczniku nazywa się osobliwą lub zdegenerowaną (przekształcenie „spłaszcza” bądź „skleja”), w przeciwnym przypadku nazywa się ją nieosobliwą lub niezdegenerowaną. Macierz jest odwracalna wtedy i tylko wtedy, gdy jest nieosobliwa, co ma z kolei miejsce wtedy i tylko wtedy, gdy jej rząd jest maksymalny, czyli równy jej stopniowi. Stąd układ równań liniowych o kwadratowej macierzy głównej ma jednoznaczne rozwiązanie wtedy i tylko wtedy, gdy wspomniana macierz ma niezerowy wyznacznik[uwaga 8] (zob. układ równań liniowych: charakteryzacja rozwiązań). Wyznaczniki stosuje się także do rozwiązywania układów równań liniowych metodą wzorów Cramera, gdzie iloraz wyznaczników dwóch powiązanych macierzy kwadratowych jest równy wartości każdej ze zmiennych układu.
Wyznacznik macierzy stopnia drugiego dany jest wzorem
Wyznacznik macierzy stopnia trzeciego można obliczyć za pomocą reguły Sarrusa, podczas gdy wzór Leibniza (znany również jako permutacyjna definicja wyznacznika) uogólnia te wzory na macierze dowolnych stopni. Twierdzenie Cauchy’ego o wyznacznikach mówi, że wyznacznik iloczynu macierzy jest równy iloczynowi ich wyznaczników, Dodanie wielokrotności dowolnego wiersza do innego (kolumny do innej) nie zmienia wartości wyznacznika; zamiana miejscami dwóch wierszy (kolumn) zmienia znak wyznacznika na przeciwny (zob. własności operacji elementarnych). Korzystając z tych operacji, dowolną macierz można przekształcić w macierz dolno- lub górnotrójkątną, a wyznacznik tego rodzaju macierzy jest równy iloczynowi elementów na przekątnej głównej (w szczególności jest to prawda dla macierzy diagonalnych).
Rozwinięcie Laplace’a umożliwia wyrażenie wyznacznika za pomocą minorów, tzn. wyznaczników podmacierzy głównych (twierdzenie to umożliwia rekurencyjne zdefiniowanie wyznacznika począwszy od wyznacznika macierzy stopnia pierwszego jako jej jedynego elementu, czy nawet wyznacznika macierzy zerowego stopnia równego z definicji jedności[uwaga 9]). Minory podmacierzy głównej (tzn. zawierające elementy głównej przekątnej) nazywa się minorami głównymi; gdy minor główny zawiera kolejne, począwszy od pierwszego, elementy głównej przekątnej, nazywa się go wiodącym minorem głównym. Wśród wszystkich niezerowych minorów tej macierzy istnieje choć jeden o największym stopniu; rząd macierzy wyznaczony jest przez stopień tego minora (nie przekracza więc liczby jej wierszy, czy kolumn). Każdy niezerowy minor macierzy stopnia równego jej rzędowi nazywa się minorem bazowym tej macierzy. Wiele wyników algebry liniowej daje się zwięźle wyrazić w języku minorów za pomocą tzw. macierzy dołączonej (bądź przestawionej względem niej macierzy dopełnień algebraicznych) zbudowanej z tzw. dopełnień algebraicznych definiowanych jako minory ustalonego znaku.
Niezmienniczość i zagadnienie własne
Każdy endomorfizm odwzorowuje całą przestrzeń, na której jest określony, w siebie (na mocy definicji endomorfizmu); podobnie zawsze odwzorowuje on w siebie podprzestrzeń zerową (wprost z definicji przekształcenia liniowego). W ogólności może on jednak odwzorowywać daną podprzestrzeń w niemającą z nią związku, zupełnie inną podprzestrzeń. Informacja o tym, które z podprzestrzeni są -niezmiennicze, czyli odwzorowywane przez w siebie, może ułatwić zrozumienie tego jak przekształcenie działa na całej przestrzeni poprzez badanie jak działa na niezależnych od siebie podprzestrzeniach składowych[uwaga 10]. W kontekście macierzy podprzestrzenie niezmiennicze mogą ułatwić ich rozkład (zob. Rozkłady macierzy)[uwaga 11].
Jako najprostsze i niosące przy tym istotną informację, szczególnie interesujące są jednowymiarowe podprzestrzenie niezmiennicze opisywane przez kierunek jednego (niezerowego) wektora nazywanego wektorem własnym danego endomorfizmu. Oznacza to, że jest on przekształcany przez endomorfizm na pewną swoją wielokrotność: Liczbę nazywa się wartością własną (stowarzyszoną z wektorem ) danego endomorfizmu w zapisie macierzowym równanie to przyjmuje postać
gdzie jest macierzą reprezentującą zaś jest macierzą współczynników wektora (w tej samej ustalonej bazie). Powyższe równanie można przekształcić do równoważnej postaci czyli zapisać w formie układu równań liniowych, gdzie jest macierzą jednostkową. Ze względu na niezerowość równanie to jest rozwiązalne, gdy macierz jest nieodwracalna lub (równoważnie) osobliwa, tzn.
Funkcja skalarna jest wielomianem stopnia nazywanym wielomianem charakterystycznym macierzy wielomian ten ma co najwyżej różnych pierwiastków, którymi są wartości własne macierzy[uwaga 12]. Zgodnie z twierdzeniem Cayleya-Hamiltona dla macierzy spełnione jest równanie macierzowe przykładowo jeśli to skąd czyli np. (zob. Rozkłady macierzy i Aspekty numeryczne)
Każda z wartości własnych opisuje przekształcenie wzdłuż wektorów własnych – tak wyznacznik, będący iloczynem wartości własnych[uwaga 13], jak i ślad, równy sumie wartości własnych, stanowią istotną informację o rodzaju przekształcenia liniowego: ślad może być interpretowany jako nieskończenie mała zmiana objętości (jako pochodna wyznacznika będącego wielomianem, zob. wzór Jacobiego), podczas gdy dodatni znak wyznacznika mówi o tym, czy przekształcenie jest złożeniem parzystej liczby symetrii[uwaga 14] (zachowuje orientację), a jego moduł opisuje przyrost wzdłuż każdego z wektorów własnych przekształcenia (tzn. jego bezwzględną zmianę pola bądź objętości).
Przykładowo dla endomorfizmów opisanych w sekcji Przekształcenia liniowe wektory są wektorami własnymi symetrii, przekształcenia ekwiafinicznego i jednokładności z wartościami własnymi odpowiednio Poglądowo oznacza to, że w przekształceniach tych łatwo można wyróżnić część działającą „w poziomie” i „w pionie”: w symetrii to kierunek „poziomy” zostaje odbity, a „pionowy” zachowany; jednostkowy iloczyn wartości własnych (tj. wyznacznik) w przekształceniu ekwiafinicznym wskazuje zachowanie pola powierzchni, z kolei równe wartości własne dla jednokładności oznaczają, że skalowanie odbywa się w każdym z kierunków w tym samym stopniu. Jedynym wektorem własnym powinowactwa jest o podwójnej wartości własnej poglądowo oznacza to, że w przekształceniu zachowywany jest tylko kierunek „poziomy” (pojedynczy wektor własny), przy czym odległości między punktami w tym kierunku również są zachowane (jednostkowa stowarzyszona wartość własna). Wektory i wartości własne przytoczonych obrotów nie wyrażają się za pomocą wielkości rzeczywistych[uwaga 15].
Symetria i określoność
Macierz określoność; stowarzyszona forma kwadratowa wektory spełniające wykres | |
nieokreślona | dodatnio określona |
Hiperbola | Elipsa |
Paraboloidy: hiperboloiczna i eliptyczna |
Macierz kwadratową równą swojemu przestawieniu, nazywa się symetryczną; jeśli jest ona równa przeciwności swojego przestawienia, to nazywa się ją antysymetryczną. W przypadku macierzy zespolonych symetrię macierzy zastępuje się często jej hermitowskością (samosprzężonością), tzn. rozpatruje się gdzie gwiazdka oznacza sprzężenie hermitowskie macierzy, tzn. złożenie przestawienia macierzy ze sprzężeniem zespolonym jej elementów.
Każdej formie dwuliniowej można przyporządkować macierz kwadratową stopnia gdzie a jest standardową bazą przestrzeni współrzędnych Jeśli macierz jest symetryczna (albo samosprzężona w przypadku zespolonym), to może być ona postrzegana jako macierz formy kwadratowej Przyłożeniu formy dwuliniowej do pary wektorów odpowiada wówczas mnożenie skąd obliczeniu wartości formy kwadratowej dla wektora odpowiada wówczas mnożenie gdzie są macierzami jednokolumnowymi zawierającymi współczynniki wektorów
Formę kwadratową nazywa się dodatnio lub ujemnie określoną albo nieokreśloną, jeżeli dla wszystkich niezerowych wektorów forma przyjmuje odpowiednio wyłącznie wartości dodatnie, ujemne, bądź obu znaków. Jeśli forma przyjmuje wyłącznie wartości nieujemne albo niedodatnie, to nazywa się ją odpowiednio określoną nieujemnie albo niedodatnio (półokreśloną dodatnio bądź ujemnie); w ten sposób forma jest nieokreślona wtedy i tylko wtedy, gdy nie jest określona ani nieujemnie, ani niedodatnio; forma mająca (choć jedną) wartość własną równą zeru nazywa się osobliwą (zdegenerowaną) w przeciwnym przypadku nazywa się ją nieosobliwą (niezdegenerowaną). Określoność macierzy definiuje się jako określoność reprezentowanej przez nią formy kwadratowej (czyli odpowiadającej jej formy dwuliniowej ); identycznie ma się rzecz ze zdegenerowaniem. Terminy dotyczące określoności form przenoszą się wprost na odpowiadające im macierze; osobliwość formy odpowiada wtedy osobliwości jej macierzy (co można również sprawdzić za pomocą wyznacznika lub rzędu).
Twierdzenie spektralne mówi, że rzeczywiste macierze symetryczne i zespolone macierze hermitowskie są diagonalizowalne, tzn. istnieje taka baza, nazywana bazą własną, w której dowolny wektor można przedstawić w postaci kombinacji liniowej wektorów własnych. Innymi słowy istnieje baza, w której dana forma kwadratowa ma macierz diagonalną, przy czym jej główna przekątna zawiera wartości własne stowarzyszone z wektorami bazy własnej – określoność formy kwadratowej (dwuliniowej), czy też jej macierzy, można zatem definiować za pomocą (znaków) jej wartości własnych (tzw. kryterium Sylvestera określoności[uwaga 16]). W szczególności diagonalizowalna jest macierz standardowego iloczynu skalarnego dowolnej przestrzeni współrzędnych, przy czym w bazie standardowej ma ona postać macierzy jednostkowej, co oznacza, że iloczyn skalarny jest dodatnio określoną formą dwuliniową na tej przestrzeni; stąd jego działanie definiuje się zwykle w zapisie macierzowym wzorem z kolei stowarzyszona z nim forma kwadratowa definiuje kwadrat standardowej normy tej przestrzeni.
Aspekty numeryczne
Oprócz własności teoretycznych macierzy i ich związków z różnymi dziedzinami wiedzy z praktycznego punktu widzenia ważne jest efektywne i dokładne przeprowadzanie obliczeń na macierzach – dział matematyki obejmujący tę problematykę nazywa się numeryczną algebrą liniową. Zasadniczymi elementami są złożoność obliczeniowa i stabilność numeryczna algorytmu realizującego obliczenia. Zwykle stosuje się algorytmy wprost implementujące dane zagadnienie bądź różnorakie podejścia iteracyjne, np. wektor własny można znaleźć, wskazując ciąg wektorów zbiegający do tego wektora własnego.
Wyznaczenie złożoności algorytmu polega na wskazaniu górnego ograniczenia lub oszacowań liczby potrzebnych dodawań i mnożeń skalarów do wykonania danego algorytmu, np. mnożenia macierzy. Standardowe mnożenie dwóch macierzy typu z definicji wymaga mnożeń, gdyż dla każdego z elementów macierzy potrzeba mnożeń. Klasyczny algorytm Strassena jest efektywniejszy niż opisany wyżej „naiwny” algorytm: potrzebuje jedynie ok. mnożeń; aby przyspieszyć obliczenia uwzględnia się również cechy i własności urządzenia liczącego. W praktyce często dostępna jest dodatkowa wiedza o postaci macierzy – ważnym przypadkiem są macierze rzadkie, tzn. macierze, których większość elementów jest zerami. Istnieją dla nich specjalnie przystosowane algorytmy, np. metoda gradientu sprzężonego rozwiązywania układów równań liniowych dla macierzy rzadkiej
Intuicyjnie algorytm jest numerycznie stabilny, jeśli małe odchylenia argumentów (np. błędy zaokrągleń) nie prowadzą do dużych odchyleń wyników; przykładowo obliczanie macierzy odwrotnej z rozwinięcia Laplace’a, tzn. wzoru (gdzie oznacza macierz dołączoną do ), może prowadzić do znaczących błędów zaokrągleń, gdy wyznacznik macierzy jest bardzo mały (co do wartości bezwzględnej). Do oceny uwarunkowania problemów algebry liniowej, jak powyższe obliczanie odwrotności macierzy, stosuje się normy macierzy; przykładowo opracowano algorytmy rozkładu macierzy, które umożliwiają uniknięcie złego uwarunkowania, np. rozkład Schura.
Ujęcie algebraiczne i uogólnienia
Definicja
Niech będą dodatnimi liczbami całkowitymi, zaś oznacza zbiór liczb kolejnych liczb całkowitych[uwaga 17], a będzie niepustym zbiorem. Macierzą nazywa się funkcję
gdzie oznacza iloczyn kartezjański zbiorów i Parę uporządkowaną oznaczaną zwykle symbolem nazywa się typem macierzy jej argumenty (elementy dziedziny) – indeksami lub wskaźnikami, zaś wartości (elementy obrazu) – współczynnikami, elementami lub wyrazami; o macierzy mówi się też wtedy, że jest określona nad zbiorem Na podobieństwo ciągów, czy wektorów funkcję oznacza się zwykle symbolicznie
gdzie element i nazywa się wyrazem, współczynnikiem bądź elementem ogólnym macierzy; zwyczajowo pierwszą i drugą współrzędną wyrazu nazywa się odpowiednio jego wierszem i kolumną. Ustalenie pierwszej bądź drugiej współrzędnej funkcji definiuje macierze odpowiednio typu bądź nazywane wierszem bądź kolumną macierzy dokładniej: -tym wierszem, odpowiednio -tą kolumną, macierzy nazywa się macierze dane wzorami bądź odpowiednio przy czym nie ma ogólnie przyjętej notacji dotyczącej wierszy, czy kolumn danej macierzy[uwaga 18] – macierze te nazywa się często wektorami wierszowymi bądź kolumnowymi, co wyjaśniono w osobnej sekcji.
Aby zaznaczyć typ macierzy często dodaje się go wyżej w pewnej formie za nawiasem, np. w indeksie dolnym: lub Zbiór wszystkich macierzy typu nad zbiorem oznacza się symbolicznie czy opuszczając niekiedy typ macierzy lub zbiór jej współczynników, jeśli są znane z kontekstu lub w szczególności oraz utożsamia się z przestrzeniami współrzędnych oraz wektorów wierszowych i kolumnowych[4][5] (w tej notacji łatwiej śledzić wymiar przestrzeni przy przekształceniach, jednak jest ona niezgodna z notacją potęgową iloczynu kartezjańskiego dla przestrzeni).
Klasy macierzy a wybór bazy
W zbiorze macierzy można wprowadzić wiele różnych relacji równoważności dzielących ten zbiór na rozłączne klasy:
- równość, definiowana wzorem dla wszystkich
- podobieństwo, mające miejsce wtedy i tylko wtedy, gdy istnieje macierz odwracalna spełniająca [6][7]
- przystawanie, kongruencja, sprzężenie, dane warunkiem istnienia takiej macierzy odwracalnej dla której
- równoważność, zachodząca wtedy i tylko wtedy, gdy istnieją macierze odwracalne że
- równoważność względem operacji elementarnych na wierszach (odp. kolumnach) lub krótko: równoważność elementarna (zwykle dla operacji na wierszach), określona wymaganiem istnienia skończonej liczby operacji elementarnych na wierszach (odp. kolumnach), które przekształcałyby daną macierz w drugą
Na relację podobieństwo, czy przystawania można nakładać dodatkowe warunki, np. wymagać, by macierze i były ortogonalne (podobieństwo/przystawanie ortogonalne, równoważność ortogonalna), czy unitarne (podobieństwo/przystawanie unitarne, równoważność unitarna). Podobieństwo macierzy pociąga ich równoważność. Dwie macierze są równoważne wtedy i tylko wtedy, gdy ich rzędy są równe. Macierze równoważne elementarnie zachowują zbiór rozwiązań układów równań liniowych (równoważność względem operacji na kolumnach zachowuje dualny do danego układ równań liniowych); dla macierzy nad dobrymi strukturami (np. ciałem, a nawet pierścieniem ideałów głównych) elementarna równoważność pokrywa się z równoważnością.
W ogólności macierz może reprezentować przekształcenie liniowe między dowolnymi przestrzeniami liniowymi skończonego wymiaru z ustalonymi bazami, czyli poprzez wybranie w nich „układów współrzędnych”, tzn. wskazanie izomorfizmów dziedziny i przeciwdziedziny z odpowiednimi przestrzeniami współrzędnych. Otóż przekształcenie liniowe przestrzeni liniowej wymiaru w przestrzeń liniową wymiaru z bazami odpowiednio oraz może być opisane dla każdego wzorem
a więc poprzez zapisanie w macierzy kolumnowo obrazów wektorów bazy w bazie
Przynależność macierzy do ustalonej klasy oznacza, iż przedstawienia we współrzędnych (wyrażone za pomocą macierzy) danego rodzaju przekształceń są niezależne od wyboru bazy: macierze danego przekształcenia liniowego w różnych bazach mogą być różne, jednak zawsze są równoważne; podobnie ma się rzecz z endomorfizmami liniowymi przestrzeni liniowej z ustaloną bazą – macierze kwadratowe danego endomorfizmu są do siebie podobne; wreszcie wybór bazy dla przestrzeni liniowej w przypadku form dwuliniowych (często symetrycznych bądź hermitowskich form kwadratowych) umożliwia zapisanie ich w postaci macierzy kwadratowych (symetrycznych bądź hermitowskich), przy czym macierze tej samej formy są przystające (podobnie ma się rzecz z formami i macierzami antysymetrycznymi). Wyznacznik i wartości własne macierzy równoważnych są równe, zatem są one niezmiennikami przekształceń liniowych; twierdzenie Sylvestera o bezwładności form kwadratowych mówi, iż liczba oraz znaki wartości własnych macierzy przystających o rzeczywistych współczynnikach są równe, co oznacza, że są one niezmiennikami rzeczywistych form kwadratowych (symetrycznych form dwuliniowych). We wszystkich przypadkach macierze pełnią rolę macierzy zmiany bazy (tzw. „macierze przejścia” z jednej bazy do innej).
Rozkłady macierzy
Wspomniana w sekcji Symetria i określoność diagonalizacja będąca przedstawieniem macierzy w postaci macierzy diagonalnej (podobnej do danej, zob. poprzednią sekcję) jest w istocie jedną z wielu innych metod rozkładów macierzy, czyli przekształcania macierzy do przystępniejszych postaci (nazywanych zbiorczo postaciami normalnymi bądź kanonicznymi); zasadniczą cechą tych rozkładów jest zachowywanie pewnych własności danych macierzy, np. wyznacznika, rzędu, czy odwrotności, które łatwo odczytać z uzyskanej postaci bądź możliwość algorytmicznego uproszczenia konkretnych operacji na macierzach określonego rodzaju.
Rozkład LU macierzy polega na przedstawieniu jej w postaci iloczynu macierzy trójkątnych: dolnej ( od ang. lower) i górnej ( od ang. upper). Wyznaczenie tego rozkładu znacząco upraszcza rozwiązywanie układów równań liniowych za pomocą tzw. podstawień w przód i wstecz; podobnie łatwo uzyskać z tej postaci odwrotność macierzy trójkątnych. Pokrewnym poprzedniemu algorytmem jest eliminacja Gaussa: przekształca daną macierz do postaci schodkowej. Obie metody można opisać za pomocą składania danej macierzy przez odpowiednie macierze elementarne odpowiadające permutacjom wierszy i dodawaniu wielokrotności danego wiersza do innego. Rozkład według wartości osobliwych wyraża dowolną macierz jako iloczyn trzech macierzy: unitarnych oraz diagonalnej gdzie oznacza macierz sprzężoną hermitowsko (w przypadku zespolonym; przestawioną w przypadku rzeczywistym) do
Rozkład według wartości własnych bądź diagonalizacja to rozkład danej macierzy na iloczyn macierzy diagonalnej i odwracalnej (macierz, którą można przedstawić w tej postaci nazywa się diagonalizowalną). Ogólną metodą rozkładu, która jest możliwa do przeprowadzenia dla dowolnej macierzy, jest rozkład Jordana przekształcający daną macierz do postaci (normalnej) Jordana, tzn. macierzy, której jedynymi niezerowymi elementami są znajdujące się na głównej przekątnej wartości własne macierzy oraz być może elementy jednostkowe znajdujące się na nadprzekątnej głównej (zob. rysunek obok). W rozkładzie według wartości własnych -tą potęgę macierzy (tzn. -krotne mnożenie macierzy przez siebie) można obliczyć według wzoru:
a potęgę macierzy diagonalnej oblicza się, podnosząc do potęgi elementy z jej przekątnej głównej – jest to znacznie prostsza operacja niż potęgowanie macierzy w postaci wyjściowej. Potęgowanie macierzy jest umożliwia zdefiniowanie eksponenty macierzy która podobnie do eksponenty rzeczywistej czy zespolonej znajduje wiele zastosowań: rozwiązywanie liniowych równań różniczkowych, obliczanie logarytmów macierzy, czy ich pierwiastków.
Współczynniki, algebra i grupy macierzy
Choć w definicji zbiór współczynników nie ma żadnej wyróżnionej struktury, to moc zastosowań metod macierzowych wynika z dodatkowej struktury algebraicznej określonej w tym zbiorze, która umożliwia zdefiniowanie podstawowych działań na macierzach, co skutkuje wprowadzeniem konkretnej struktury algebraicznej w zbiorze macierzy ustalonego typu, czy rodzaju. W artykule skupiono się na ciałach (którymi są np. zbiór liczb rzeczywistych, czy zespolonych), choć uprawianie algebry liniowej za pomocą teorii macierzy możliwe jest już w przypadku zastosowania pierścieni (np. zbioru liczb całkowitych).
Zbiór macierzy tworzy grupę ze względu na dodawanie macierzy z macierzą zerową złożoną z samych zer pełniącą rolę elementu neutralnego; jeśli dodawanie w zbiorze współczynników jest przemienne (z definicji w ciele lub pierścieniu przemiennym), to jest ona abelowa. Dołączenie mnożenia przez skalary czyni z grupy przestrzeń liniową (wymiaru ) w przypadku, gdy zbiór skalarów ma strukturę ciała lub moduł (wolny rangi ), jeśli skalary tworzą pierścień[uwaga 21]. Mnożenie macierzy nad pierścieniem nieprzemiennym określa się analogicznie jak w przypadku ciał, jednak działanie to nie ma wówczas tak dobrych własności.
Zbiór macierzy kwadratowych stopnia tworzy nieprzemienny pierścień z jedynką ze względu na mnożenie nazywany pierścieniem macierzy; uwzględniając strukturę przestrzeni liniowej (modułu) macierze kwadratowe danego stopnia są nieprzemienną algebrą nad ciałem z jedynką (nieprzemienną algebrą nad pierścieniem). Macierze odwrotna i odwracalna są elementami odwrotnym i odwracalnym w algebrze macierzy kwadratowych; zbiór macierzy odwracalnych ustalonego stopnia tworzy ze względu na mnożenie macierzy ogólną lub pełną grupę liniową generowaną przez macierze elementarne. Grupami macierzowymi nazywa się właśnie podgrupy ogólnej grupy liniowej (z działaniem mnożenia); jest nią np. szczególna lub specjalna grupa liniowa składająca się z macierzy odwracalnych o wyznaczniku jednostkowym (podgrupa normalna generowana przez operację elementarną dodawania wiersza pomnożonego przez odwracalną liczbę do innego w przypadku ciał). Każda grupa skończona jest izomorficzna z grupą macierzową, można się o tym przekonać, rozpatrując reprezentację regularną grupy symetrycznej. Ogólne grupy można badać za pomocą dobrze znanych grup macierzy, które zostały dość dobrze poznane dzięki teorii reprezentacji.
Jeżeli pierścień współczynników macierzy kwadratowej jest przemienny, to możliwe jest zdefiniowanie jej wyznacznika[uwaga 22]. Niezerowość wyznacznika dla macierzy określonych nad ciałami należy zamienić w przypadku pierścieni na warunek jego odwracalności. Ze wzorów Cramera (własności macierzy dołączonej) wynika, że macierz kwadratowa nad pierścieniem przemiennym jest odwracalna wtedy i tylko wtedy, gdy jest nieosobliwa.
Nad (przemienną) dziedziną ideałów głównych podmoduł modułu wolnego jest wolny, a jego ranga nie przekracza rangi całego modułu. W związku z tym owocne jest dla macierzy typu nad dziedziną ideałów głównych rozważanie podmodułów modułów oraz generowanych odpowiednio przez kolumny i wiersze macierzy Podmoduły te mają równe rangi, a ich wspólną wartość nazywa się rzędem macierzy Rząd jest równy największemu stopniowi jej niezerowego minora i jest równy rzędowi tej samej macierzy nad ciałem ułamków pierścienia rząd macierzy nie przekracza liczby jej wierszy i kolumn.
Ponieważ macierze można traktować jak („długie”) wektory (najczęściej nad pewnym ciałem, takim jak np. liczby rzeczywiste, czy liczby zespolone), to w wielu przypadkach możliwe jest wprowadzenie przeróżnych struktur algebraicznych, czy topologicznych na różnego rodzaju przestrzeniach macierzy, co wynika stąd, iż zbiór macierzy ustalonego typu tworzy skończeniewymiarową przestrzeń liniową z działaniami na macierzach (traktowanych jak wektory, tzn. wprowadzonymi „po wskaźnikach”) – każda z tych przestrzeni ma identyczną strukturę z przestrzenią współrzędnych nad tym ciałem. Dla macierzy nad ciałami liczb rzeczywistych, czy zespolonych można przykładowo wprowadzić strukturę przestrzeni euklidesowej z jej naturalnymi strukturami, a nawet pójść krok dalej: wprowadzić strukturę algebry Liego, co w dalszym stopniu zwiększa liczbę zastosowań teorii macierzy.
Jeśli współczynniki należą do ciała liczb rzeczywistych lub zespolonych, to ogólna grupa liniowa ma strukturę grupy Liego (wymiaru równemu stopniowi macierzy w przypadku rzeczywistym i dwukrotnie większemu w przypadku zespolonym), tzn. mnożenie i odwracanie macierzy są ciągłe (w topologii euklidesowej macierzy traktowanych jako „długie” wektory[uwaga 23]). Ponadto jest otwartą rozmaitością afiniczną w przestrzeni wszystkich macierzy ustalonego stopnia (jej niepustym podzbiorem otwartym w topologii Zariskiego), a nawet rozmaitością różniczkową (tego samego wymiaru). Algebra Liego odpowiadająca tej grupie, tzn. struktura oddająca intuicję nieskończenie małych przekształceń tych grup (por. pochodna Liego), składa się ze wszystkich macierzy kwadratowych tego samego stopnia z komutatorem pełniącym rolę nawiasu Liego; algebra Liego specjalnej grupy liniowej (będącą podrozmaitością ogólnej grupy liniowej) zawiera wszystkie macierze kwadratowe ustalonego stopnia o zerowym śladzie.
Macierze nieskończone i puste
Rozpatruje się również macierze o nieskończonej liczbie wierszy i/lub kolumn – formalnie wystarczy, iż dla dowolnych elementów indeksujących wiersze i kolumny istnieje dobrze określony element macierzy (zbiory indeksów nie muszą być nawet podzbiorami liczb naturalnych). Analogicznie jak w przypadku skończonym można zdefiniować dodawanie, odejmowanie, mnożenie przez skalar, czy przestawienie macierzy, choć mnożenie macierzy wymagać może określenia nieskończonego sumowania do zdefiniowania elementów iloczynu. Jeśli macierz nieskończona ma opisywać przekształcenie liniowe, to jej wszystkie kolumny muszą mieć skończoną liczbę niezerowych elementów. Wynika to stąd, iż dla macierzy reprezentującej przekształcenie liniowe z ustalonymi bazami dla przestrzeni liniowych, każdy wektor przestrzeni może być zapisany jednoznacznie jako (skończona) kombinacja liniowa wektorów bazowych, a więc jako macierz jednokolumnową („wektor kolumnowy”) w której tylko skończenie wiele elementów jest różnych od zera. Wówczas kolumny zawierają kolejne obrazy w przekształceniu macierzy jednokolumnowych odpowiadających obrazom wektorów bazowych przestrzeni w bazie przestrzeni co ma sens wyłącznie wtedy, gdy kolumny te mają skończenie wiele niezerowych elementów. Nie ma jednakże ograniczenia na liczbę wierszy macierzy otóż w iloczynie pojawia się tylko skończenie wiele niezerowych współczynników macierzy jednokolumnowej przez co każdy z elementów tego iloczynu, nawet jeśli jest dany jako nieskończona suma iloczynów, zawiera tylko skończenie wiele różnych od zera elementów, skąd wynika, iż jest on dobrze określony. Co więcej, oznacza to utworzenie kombinacji liniowej kolumn macierzy która efektywnie zawiera wyłącznie skończenie wiele z nich, stąd ponieważ każda kolumna zawiera tylko skończenie wiele niezerowych elementów, to i wynik ma ich tyle. Iloczyn dwóch macierzy danego typu jest również dobrze określony (z zastrzeżeniem równości zbiorów indeksujących odpowiednio wiersze i kolumny tych macierzy), jest tego samego typu i odpowiada złożeniu przekształceń liniowych.
Macierze nieskończone wykorzystuje się do opisu operatorów na przestrzeni Hilberta, gdzie narzuca się dodatkowe ograniczenia ze względu na zbieżność odpowiednich sum oraz ciągłość przekształceń. Z ogólnego punktu widzenia macierze jednak zaciemniają ogląd – z tego powodu częściej korzysta się z abstrakcyjnych, potężniejszych metod analizy funkcjonalnej.
Macierz pusta to macierz, której liczba wierszy lub kolumn jest równa zeru. Ułatwiają one rozważania teoretyczne dotyczące zerowej przestrzeni liniowej, np. jeśli macierz jest typu a macierz jest typu to ich iloczyn jest macierzą zerową typu odpowiadającą przekształceniu zerowemu pewnej trójwymiarowej przestrzeni liniowej w siebie, podczas gdy iloczyn jest macierzą typu Nie ma ustalonej notacji dotyczącej macierzy pustych, choć większość systemów algebry komputerowej umożliwia ich tworzenie i prowadzenie obliczeń z ich udziałem. Wyznacznik macierzy typu wynosi jeden, co wynika z obecności iloczynu pustego występującego we wzorze Leibniza na wyznacznik. Wartość ta jest zgodna z faktem służącym często charakteryzacji wyznacznika, iż przekształcenie tożsamościowe z dowolnej skończeniewymiarowej przestrzeni liniowej w siebie ma wyznacznik 1. Istnienie macierzy stopnia zerowego jest niezbędne w rozważaniach teoriokategoryjnych – macierze nad ustalonym ciałem tworzą kategorię addytywną, która musi zawierać obiekt zerowy, tu: macierze puste.
Tensory
Macierze wielowskaźnikowe to macierze z dowolną liczbą wskaźników indeksujących elementy takiej macierzy – macierze zerowskaźnikowe to opisane wyżej macierze puste, jednowskaźnikowe mogą być utożsamiane z wektorami lub ciągami, dwuwskaźnikowe to macierze opisane w tym artykule (również nieskończone), macierze trójwskaźnikowe można wyobrażać sobie jako uszeregowane w kratkach prostopadłościanu (być może nieskończonego). Formalnie macierz -wskaźnikowa o elementach ze zbioru to funkcja
Zastosowania
Macierze znalazły mnóstwo zastosowań, tak w matematyce, jak i w naukach przyrodniczych – niektóre z nich wykorzystują jedynie zwarty sposób zapisu zbioru liczb w postaci tablicy. Przykładowo w teorii gier i ekonomii macierz wypłat koduje wypłatę gracza w zależności od jego wyboru spośród (skończonego) zbioru możliwości. W eksploracji tekstu i automatycznym kompilowaniu tezaurusów korzysta się z macierzy częstości dokument-słowo (albo macierzy częstotliwości słowo-dokument; ang. document-term [frequency] matrix, DTM albo term-document [frequency] matrix, TDM), np. tf-idf, do śledzenia częstości pewnych słów w kilku dokumentach.
Liczby zespolone można przedstawić za pomocą szczególnych macierzy rzeczywistych typu za pomocą odwzorowania
w którym dodawanie i mnożenie liczb zespolonych oraz macierzy odpowiadają sobie wzajemnie. Przykładowo macierze obrotu stopnia odpowiadają mnożeniu przez liczbę zespoloną o module (por. Przekształcenia liniowe). Podobnej interpretacji można dokonać dla kwaternionów.
Wczesne techniki szyfrowania (np. szyfr Hilla) można opisać za pomocą macierzy, jednakże oznacza to, że kody te są względnie łatwe do złamania (z powodu ich liniowej natury). W grafice komputerowej macierze wykorzystuje się do reprezentowania obiektów oraz ich przekształceń afinicznych – przykładem może być rzut trójwymiarowego obiektu na dwuwymiarowy ekran uwzględniający teoretyczną pozycję obserwatora (kamery). Macierze nad pierścieniami wielomianów są istotnym elementem opisu w teorii sterowania.
W chemii macierze wykorzystuje się na wiele sposobów – w szczególności, ze względu na wykorzystanie teorii kwantów, do opisu wiązań między cząsteczkami i spektroskopii. Przykładami są macierz nakładania (ang. overlap matrix) i macierz Foka wykorzystywane do rozwiązywania równań Roothaana w celu uzyskania orbitali cząsteczkowych za pomocą metody Hartree’ego-Foka.
Teoria grafów
Jednym z fundamentalnych obiektów teorii grafów jest macierz sąsiedztwa skończonego grafu – zapisana jest w niej informacja o tym, które wierzchołki grafu są połączone krawędzią. Innym sposobem opisu takiego grafu jest macierz incydencji parująca wierzchołki i krawędzie. Macierze zawierające tylko dwie różne wartości (0 i 1 oznaczające przykładowo „tak” i „nie”) nazywa się macierzami logicznymi. Z kolei macierz odległości (lub kosztów) zawiera informację o wzajemnych odległościach krawędzi. Pojęcia te stosuje się do opisu rozmieszczenia (topologii) witryn internetowych połączonych odnośnikami, czy miastami połączonymi za pomocą dróg; jeśli sieć dróg nie jest zbyt gęsta, to macierze są zwykle rzadkie, tzn. zawierają mało niezerowych elementów. Dla tego rodzaju macierzy istnieją odpowiednio przystosowane algorytmy stosowane w teorii sieci.
Analiza i geometria
Macierz Hessego funkcji różniczkowalnej o wartościach skalarnych (tzw. pola skalarnego) składa się z drugich pochodnych funkcji względem osi współrzędnych, tzn.
Koduje ona informację o lokalnym wzroście funkcji: dla danego punktu krytycznego czyli punktu, w którym znikają pierwsze pochodne cząstkowe funkcji przyjmuje ona minimum lokalne, o ile macierz Hessego jest dodatnio określona (i maksimum lokalne, gdy jest ona ujemnie określona). W celu znalezienia minimów i maksimów funkcji kwadratowych blisko związanych z formami kwadratowymi stowarzyszonymi z macierzami (zob. Określoność) stosuje się programowanie kwadratowe.
Inną macierzą często stosowaną w ujęciu geometrycznym problemów analitycznych jest macierz Jacobiego przekształcenia różniczkowalnego Jeśli oznaczają składowe to macierz Jacobiego można zdefiniować jako
Jeśli i rząd macierzy Jacobiego przyjmuje swoją maksymalną wartość to z twierdzenia o przekształceniu odwrotnym[uwaga 24] jest lokalnie odwracalna w tym punkcie.
Równania różniczkowe cząstkowe można sklasyfikować za pomocą macierzy współczynników operatorów różniczkowych najwyższego rzędu danego równania. Dla eliptycznych równań różniczkowych cząstkowych macierz ta jest dodatnio określona, co ma decydujący wpływ na zbiór możliwych rozwiązań badanego równania.
Ważną metodą rozwiązywania równań różniczkowych cząstkowych opisujących złożone układy fizyczne jest metoda elementów skończonych, w której rozwiązanie jest przybliżane za pomocą funkcji kawałkami liniowych, gdzie kawałki dostatecznie drobne; metodę można następnie przedstawić w postaci równania macierzowego (zob. też metoda sztywności).
Rachunek prawdopodobieństwa i statystyka
Macierze stochastyczne to macierze, których wiersze odpowiadają wektorom prawdopodobieństwa, tzn. elementy wierszy sumują się do jedności. Macierze stochastyczne definiują łańcuchy Markowa o skończonej liczbie stanów. Wiersz macierzy stochastycznej opisuje rozkład prawdopodobieństwa następnego położenia danej cząstki w stanie odpowiadającym temu wierszowi. Własności łańcucha Markowa takie jak stany pochłaniające, tzn. stany, które dana cząstka kiedyś osiągnie, można odczytać z wartości własnych macierzy przejścia. Ze względu na pokrewieństwo łańcuchów Markowa o skończonej liczbie stanów z grafami o skończonej liczbie wierzchołków do opisu pierwszych stosuje się metody opracowane dla drugich (zob. Teoria grafów).
W statystyce również korzysta się z wielu rodzajów macierzy – statystyka opisowa zajmuje się przykładowo opisem zbiorów danych, które można często przedstawić w postaci macierzowej przez uprzednie zmniejszenie liczby danych. Macierz kowariancji koduje wariancję wzajemną kilku zmiennych losowych. Kolejnym przykładem jest metoda najmniejszych kwadratów, w której przybliża się skończoną liczbę punktów funkcją liniową
metodę tę można opisać w języku macierzy, opierając się na rozkładzie według wartości osobliwych macierzy.
Macierze losowe to macierze zawierające liczby losowe podlegające odpowiedniemu rozkładowi prawdopodobieństwa, np. macierzowemu rozkładowi normalnemu. Ich zastosowania wykraczają poza rachunek prawdopodobieństwa – stosuje się je od teorii liczb po fizykę.
Symetrie i przekształcenia w fizyce
Przekształcenia liniowe i związane z nimi symetrie odgrywają we współczesnej fizyce kluczową rolę. Przykładowo w kwantowej teorii pola cząstki elementarne klasyfikuje się jako reprezentacje grupy Lorentza szczególnej teorii względności, dokładniej: względem ich zachowania w działaniu grupy spinowej. Konkretne reprezentacje, w tym macierze Pauliego, czy ogólniejsze macierze gamma, są integralną częścią opisu fermionów zachowujących się jak spinory. Dla trzech najlżejszych kwarków istnieje grupowa reprezentacja wykorzystująca specjalną grupę unitarną do obliczeń wykorzystuje się dogodne reprezentacje macierzowe znane jako macierze Gell-Manna, które stosuje się także do opisu grupy cechowania tworzącej podstawę współczesnego opisu silnych oddziaływań jądrowych, chromodynamiki kwantowej. Z kolei macierz Cabibbo-Kobayashiego-Maskawy wyraża fakt, iż podstawowe stany kwarków, istotne dla oddziaływań słabych, nie są podstawowymi stanami kwarków definiującymi cząstki z określonymi i różnymi masami, lecz są od nich liniowo zależne.
Kombinacje liniowe stanów kwantowych
Pierwszy model mechaniki kwantowej (Heisenberg, 1925) przedstawiał operatory tej teorii za pomocą nieskończeniewymiarowych macierzy działających na stanach kwantowych; stąd pierwotna nazwa tej teorii to mechanika macierzowa. Szczególnym przykładem jest macierz gęstości charakteryzująca stan „mieszany” układu kwantowego jako kombinację liniową prostych, „czystych” stanów własnych.
Inna macierz służy jako kluczowe narzędzie opisu eksperymentów rozpraszania tworzących zrąb eksperymentalnej fizyki cząstek elementarnych: reakcje zderzenia, takie jakie zdarzają się w akceleratorach cząstek, gdzie nieoddziałujące na siebie cząstki pędzą ku sobie i zderzają się na małym obszarze oddziaływania, produkując nowy zestaw nieoddziałujących ze sobą cząstek, mogą być opisane za pomocą iloczynu skalarnego stanów cząsteczek wyjściowych i kombinacji liniowej stanów cząsteczek wejściowych. Kombinacja liniowa jest dana w postaci macierzy rozpraszania znanej także jako macierz S, która koduje wszystkie informacje o możliwych oddziaływaniach między cząstkami.
Drgania swobodne
W fizyce macierze stosuje się również do opisu liniowo sprzężonych układów harmonicznych. Równania ruchu takich układów można opisać za pomocą macierzy, gdzie macierz masy przemnożona przez uogólnioną prędkość daje wyraz kinetyczny, a macierz siły przemnożona przez macierz przesunięcia (odpowiadającą wektorowi przesunięcia) charakteryzuje interakcje. Najlepszą metodą uzyskiwania rozwiązań jest wyznaczenie wektorów własnych układu, jego drgań swobodnych, poprzez diagonalizację równania macierzowego. Techniki tego rodzaju są istotne, gdy w grę wchodzi wewnętrzna dynamika cząsteczek: drgania wewnętrzne układu składającego się ze wzajemnie związanych atomów. Wykorzystuje się je również do opisu drgań mechanicznych i oscylacji w obwodach elektrycznych.
Optyka geometryczna
W optyce geometrycznej, która z natury jest teorią aproksymatywną, zaniedbuje się falową naturę światła – w modelu tym promienie świetlne rozchodzą się po prostych. Jeśli ugięcie światła przez dany przyrząd optyczny nie jest duże, działanie soczewki czy zwierciadła można wyrazić za pomocą mnożenia macierzy odpowiadającej wektorowi o dwu składowych przez macierz układu optycznego typu nazywaną macierzą ABCD: elementami macierzy odpowiadającej wektorowi są nachylenie promienia i jego odległość od osi optycznej, macierz kwadratowa koduje z kolei własności urządzenia optycznego. W istocie wyróżnia się dwa rodzaje macierzy, tj. macierz załamania (lub refrakcji) opisująca załamanie na powierzchni soczewki oraz macierz przesunięcia (lub translacji), która opisuje przesunięcie płaszczyzny odniesienia do kolejnej płaszczyzny załamania, której opisem jest kolejna macierz załamania. Dzięki temu układ optyczny złożony z kombinacji soczewek i/lub zwierciadeł można opisać za pomocą macierzy będącej iloczynem macierzy elementów tego układu.
Elektronika
Tradycyjna analiza obwodów elektrycznych prowadzi do układów równań liniowych, które mogą być opisane za pomocą macierzy (np. metoda prądów oczkowych, czy metoda napięć/potencjałów węzłowych).
Zachowanie wielu elementów elektronicznych może być opisane za pomocą macierzy: niech oznacza macierz typu którego pierwszym elementem jest napięcie a drugą natężenie wejściowe tego elementu, zaś będzie macierzą tego samego typu z kolejnymi elementami napięcia i natężenia wyjściowego elementu. Zachowanie elementu elektronicznego można opisać wzorem gdzie jest macierzą typu zawierającą impedancję (zawadę) i admitancję (drożność) kolejno jako elementy antyprzekątnej głównej i dwa elementy bezwymiarowe na przekątnej głównej. Rozwiązanie obwodu sprowadza się wówczas do mnożenia macierzy.
Historia
Prekursorzy
Za pierwsze macierze można uważać kwadraty magiczne które w literaturze chińskiej pojawiają się już ok. 650 p.n.e.[8] Kwadraty magiczne były znane także arabskim matematykom, prawdopodobnie już w VII wieku, kiedy Arabowie podbili północno-zachodnie części subkontynentu indyjskiego, przejmując zdobycze matematyki i astronomii hinduskiej – być może idea ta dotarła do nich z Chin. Pierwsze kwadraty magiczne rzędu 5 i 6 pojawiły się w Encyklopedii Bractwa Czystości (arab. رسائل أخوان الصفا و خلان الوفا) z Bagdadu około 983 roku. Prostsze kwadraty magiczne były znane wielu wcześniejszym matematykom arabskim[8].
Powstały między III wiekiem p.n.e. a II wiekiem n.e. traktat Dziewięć rozdziałów o sztuce matematyki (Jiu Zhang Suan Shu) jest pierwszym zanotowanym przypadkiem użycia macierzy do rozwiązania układów równań liniowych[9] W rozdziale siódmym, Zbyt dużo i nie wystarczająco, po raz pierwszy wprowadzono koncepcję wyznacznika, przeszło 1000 lat przed jego publikacją przez Kōwę Sekiego w 1683 roku i Gottfrieda Leibniza w 1693 roku. Gabriel Cramer opublikował swoje wzory dające pełny algorytm rozwiązywania układów równań liniowych dopiero w 1750 roku.
Właściwe pojęcie
Wczesna teoria macierzy bardziej niż na same macierze kładła nacisk na wyznaczniki – niezależne pojęcie macierzy bliskie współczesnemu pojawiło się dopiero w 1858 roku w pracy Arthura Cayleya „Pamiętnik o teorii macierzy” (Memoir on the theory of matrices). Słowo „macierz” (łac. matrix – samica rozpłodowa, roślina macierzysta; od matr-, mater – matka; niegdyś właśnie „macierz”) ukuł James Joseph Sylvester, który macierz rozumiał jako obiekt dający wyznaczniki znane dzisiaj jako minory (zob. Wyznacznik)[10] W pracy z 1851 roku Sylvester tłumaczy:
- „W poprzednich pracach zdefiniowałem «Macierz» jako prostokątną tablicę wyrazów, z której jak z łona jednego rodzica wyłonić można przeróżne układy wyznaczników”[11]
Badania nad wyznacznikami rozpoczęto z kilku powodów.
- Problemy teorii liczb doprowadziły Carla Friedricha Gaussa do związania współczynników form kwadratowych, tzn. wyrażeń postaci i trójwymiarowych przekształceń liniowych z macierzami.
- Gotthold Eisenstein rozwinął te pojęcia w dalszym stopniu, w tym fakt, iż (w języku współczesnym) iloczyny macierzy nie są przemienne.
- Augustin Cauchy jako pierwszy udowodnił ogólne twierdzenia o wyznacznikach, korzystając z następującej definicji wyznacznika macierzy zastąp w wielomianie potęgi wyrazem gdzie oznacza iloczyn wskazanych wyrazów. Wykazał on również w 1829 roku, że wartości własne macierzy symetrycznych są rzeczywiste.
- Carl Gustav Jakob Jacobi badał „wyznaczniki funkcyjne”, nazywane później przez Sylvestera wyznacznikami Jacobiego, za pomocą których możliwy jest opis przekształceń geometrycznych na poziomie lokalnym (lub infinitezymalnym).
W dziełach Leopolda Kroneckera „Wykłady o teorii wyznaczników” (Vorlesungen über die Theorie der Determinanten) i Karla Weierstrassa „O teorii wyznaczników” (Zur Determinantentheorie), obu opublikowanych w 1903 roku, po raz pierwszy opisano wyznaczniki w sposób aksjomatyczny, w przeciwieństwie do mniej abstrakcyjnego podejścia stosowanego przez Cauchy’ego. Rok ten przyjmuje się jako datę precyzyjnego ustalenia definicji wyznacznika.
Rozwój teorii
Początkowo wiele twierdzeń udowodniono dla małych macierzy, przykładowo Cayley dowiódł twierdzenie Cayleya-Hamiltona w przypadku macierzy typu i przez Williama Rowana Hamiltona dla macierzy typu Georg Frobenius, rozwijając teorię form dwuliniowych, uogólnił twierdzenie na macierze dowolnego typu (1898). Także pod koniec XIX wieku Wilhelm Jordan przedstawił metodę rozwiązywania układów równań liniowych znaną dziś jako metoda eliminacji Gaussa-Jordana (jako uogólnienie przypadku szczególnego znanego dziś jako metoda eliminacji Gaussa, przy czym Gauss, którego nazwisko noszą obie procedury, nie wniósł wkładu w rozwój żadnej z nich). Z początkiem XX wieku macierze osiągnęły swoją kluczową pozycję w algebrze liniowej (częściowo dzięki ich wykorzystaniu przy klasyfikacji układów liczb hiperzespolonych w poprzednim stuleciu).
Powstanie mechaniki macierzowej dzięki wysiłkom Wernera Heisenberga, Maksa Borna i Pascuala Jordana doprowadziły do badań nad macierzami o nieskończonej liczbie wierszy i kolumn. W dalszej kolejności John von Neumann dał matematyczny opis mechaniki kwantowej rozwinąwszy takie pojęcia analizy funkcjonalnej jak operator liniowy na przestrzeniach Hilberta, które zgrubnie rzecz ujmując, odpowiadają przestrzeniom euklidesowym o nieskończenie wielu niezależnych kierunkach.
Inne znaczenia terminu
Samo słowo „macierz” stosowane było w kontekście matematycznym w niestandardowy sposób przynajmniej przez dwóch, ważnych historycznie autorów.
Bertrand Russell i Alfred North Whitehead w ich Principia Mathematica (1910–1913) wykorzystują słowo „macierz” w kontekście wprowadzonego przez nich aksjomatu redukowalności. Zaproponowali oni ten aksjomat w celu zredukowania dowolnej funkcji do funkcji niższego typu tak, by „na dnie” (typ 0) funkcja była identyczna ze swoim rozszerzeniem:
- „Macierzą nazwiemy dowolną funkcję, jakkolwiek wielu zmiennych, która nie wykorzystuje żadnych zmiennych pozornych. Wówczas dowolną możliwą funkcję inna od macierzy można otrzymać za pomocą uogólnienia, tzn. rozpatrzenia sądu zapewniającego, iż rzeczona funkcja jest prawdziwa dla wszystkich możliwych wartości bądź dla pewnej wartości jednego z argumentów pozostały argument lub argumenty pozostają nieokreślone”[12].
Przykładowo funkcja dwóch zmiennych i może być zredukowana do kolekcji funkcji jednej zmiennej, tzn. poprzez „rozpatrywanie” funkcji wszystkich możliwych wartości „indywiduów” podstawionych w miejsce zmiennej Uzyskana kolekcja funkcji jednej zmiennej tzn. może być zredukowana do „macierzy” wartości „rozpatrując” funkcję dla wszystkich wartości „indywiduów” wstawionych w miejsce zmiennej tzn.
Alfred Tarski w swoim „Wprowadzeniu do logiki” (Introduction to Logic) z 1946 roku używał słowa „macierz”, mając na myśli tabelę prawdy wykorzystywaną w logice matematycznej[13].
Zobacz też
- spis macierzy
- rachunek macierzowy
Uwagi
- Zasadniczo nazwy niewiadomych w poszczególnych równaniach kodowane są za pomocą ich pozycji w tablicy – zwykle kolejne równania (jak w zwyczajowej notacji) znajdują się w kolejnych wierszach, z kolei każdej niewiadomej odpowiada wybrana kolumna.
- Typowymi przykładami mogą być współrzędne jednorodne punktów świata przedstawionego, na których operuje się za pomocą wybranych macierzy przekształceń, czy kwaterniony w reprezentacji macierzowej służące przede wszystkim modelowaniu trójwymiarowych obrotów w sposób niewyróżniający żadnego kierunku (w obu przypadkach zwykle czterowymiarowe).
- Oczywiście z macierzą incydencji, tak jak z każdą macierzą, można stowarzyszyć przekształcenie liniowe przez nią reprezentowane. Przekształcenie to nie pełni jednak żadnej istotnej roli w teorii grafów.
- Niegdyś do rozwiązywania układów równań liniowych stosowało się (wprowadzone przez polskiego astronoma Tadeusza Banachiewicza) tzw. krakowiany, czyli macierze z działaniem mnożenia podobnym do iloczynu Cauchy’ego, w którym dany element jest sumą iloczynów kolejnych elementów kolumn (a nie kolumny i wiersza) – w szczególności nie jest ono przemienne, ani łączne. Podejście to upraszcza jednak wiele wzorów, usprawnia obliczenia numeryczne przy obliczeniach ręcznych i z zastosowaniem komputerów z pamięcią sekwencyjną oraz ułatwia sprawdzanie obliczeń poprzez sumy kontrolne; zob. też mnożenie macierzy.
- Macierz elementarna jest macierzą przekształcenia liniowego, którym jest operacja elementarna, por. macierz przekształcenia liniowego.
- Ogólnie: -wymiarowej objętości (mierze) obrazu -wymiarowej kostki (-wymiarowego prostopadłościanu/przedziału jednostkowego), tzn. pewnego -wymiarowego równoległościanu.
- Tzn. permutuje wektory bazy uporządkowanej (bądź rozpinające -wymiarowy równoległościan) za pomocą nieparzystej liczby transpozycji.
- Ogólny przypadek wykorzystujący pojęcie rzędu opisuje twierdzenie Kroneckera-Capellego.
- Zob. sekcję Macierze puste.
- Chodzi o podprzestrzenie, których (wewnętrzna) suma prosta daje całą przestrzeń; zob. twierdzenie o endomorfizmie.
- Może to być szczególnie widoczne po wybraniu odpowiedniej bazy.
- Ponadto gdzie oznacza sumę wszystkich minorów głównych -tego stopnia danej macierzy (por. wzory Viète’a); w szczególności oraz (oraz zob. macierz pusta).
- W szczególności: macierz jest nieosobliwa, jeśli wszystkie jej wartości własne są różne od zera.
- W przypadku dwuwymiarowym – symetrii osiowych, w przypadku trójwymiarowym – symetrii płaszczyznowych, w ogólności – symetrii względem hiperpłaszczyzny.
- Wykorzystując do opisu tych przekształceń liczby zespolone, okazuje się, że wektorami własnymi danego obrotu stowarzyszonymi z wartościami własnymi są Biorąc pod uwagę, że mnożenie przez jednostkę urojoną oznacza obrót o (w ustalonym kierunku, umownie „przeciwnie do ruchu wskazówek zegara”), a ogólniej dana (niezerowa) liczba zespolona to obrót o ustalony kąt (argument/faza) połączony ze skalowaniem o ustalony współczynnik (moduł/amplituda), wartości własne o jednostkowym module można interpretować jako zachowujące pole, zaś ich argument wskazuje kąt obrotu, z kolei wektory własne wskazują zachowane kierunki w przestrzeni trzeciego wymiaru (jako że muszą mieć one postać dla dowolnej liczby zespolonej ): kierunek prostopadły do „poziomego” i „pionowego” (por. płaszczyzna zespolona, liczby zespolone: reprezentacja macierzowa, kwaterniony, iloczyn wektorowy).
- W innej postaci: jeśli oznacza wiodący minor główny, to wartości własne zgodnie z sekcją Macierze puste,
- Definicję tę można rozszerzyć o tzw. macierze puste: wystarczy, by zbiór wskaźników był pusty.
- Przestrzenie oraz można w naturalny sposób utożsamiać z przestrzenią poprzez rzuty; w tym wypadku chodzi o utożsamienie wektorów postaci przy ustalonych oraz skalara
- Dolne „piętro” diagramu można zastąpić przekształceniem w postaci macierzy między macierzowymi przestrzeniami współrzędnych i wektorów kolumnowych bądź i wektorów wierszowych.
- Z punktu widzenia teorii kategorii kategorie skończeniewymiarowych przestrzeni liniowych i przestrzeni macierzy nad wspólnym ciałem są równoważne; kategoria skończeniewymiarowych przestrzeni liniowych jest równoważna z podkategorią skończeniewymiarowych przestrzeni współrzędnych.
- Za bazę można wybrać zbiór macierzy, których elementami są jedna jedynka i same zera.
- W przypadku, gdy pierścień nie jest przemienny, zwykle nie można przedstawić sensownej definicji; niekiedy jednak jest to możliwe, np. wyznacznik Dieudonnégo dla pierścieni z dzieleniem i jego uogólnienie, funktor Dieudonnégo, na algebry centralne proste.
- Tzn. w dowolnym izomorfizmie
Przypisy
Bibliografia
Literatura dodatkowa
Linki zewnętrzne
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.