Loading AI tools
Z Wikipedii, wolnej encyklopedii
Model statystyczny – hipoteza lub układ hipotez, sformułowanych w sposób matematyczny (odpowiednio w postaci równania lub układu równań), który przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywanymi zjawiskami rzeczywistymi.
Bardziej formalnie jest to parametryzowana rodzina rozkładów łącznych rozważanych zmiennych, stąd druga nazwa przestrzeń statystyczna.
Modele statystyczne używane w ekonometrii noszą nazwę modeli ekonometrycznych.
Niech
będzie rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby indeksowaną parametrem (w szczególności może to być wektor parametrów rzeczywistych). opisuje wielowymiarowy łączny rozkład wszystkich obserwacji w próbie
Formalnie model statystyczny to para:
Niech próba opisywana przez rozkład będzie wektorem niezależnych zmiennych losowych z których każda ma rozkład a jej zbiorem wartości jest nazywany jest -elementową próbą z rozkładu
W takim przypadku stosowany jest również zapis
W praktycznych zastosowaniach podaje się po prostu warunek, jaki spełniają rozkłady z rodziny Zmienne losowe występujące w tym warunku determinują przestrzeń próby a parametry tworzą wektor
Model nieparametryczny to model w którym nie istnieje skończenie wymiarowa parametryzacja rodziny rozkładów, czyli nie da się go zapisać w takiej postaci, że
Nie oznacza to braku jakiejkolwiek parametryzacji – to byłoby sprzeczne z definicją modelu statystycznego – np. może być rodziną dystrybuant.
Jeśli zachodzi:
to model nazywany jest identyfikowalnym. Oznacza to, że parametr jest jednoznacznie wyznaczony przez rozkład
Ogólna postać liniowego modelu o G równaniach łącznie współzależnych i tylu zmiennych endogenicznych (objaśnianych) oraz K dodatkowych zmiennych egzogenicznych (objaśniających) przy liczbie t obserwacji:
Najprostszym modelem stosowanym w prognozie jest linia trendu, w której zakładamy następującą zależność między zmienną objaśniającą (oznaczającą czas) a zmienną objaśnianą
gdzie:
Jako przykład klasycznych modeli liniowych rozpatrywanych w statystyce wskazać można również liniowy model prawdopodobieństwa (LMP), tj. najprostszy model regresji pozwalający prognozować występowalność rozpatrywanego zdarzenia. Model ten przyjmuje postać:
gdzie:
LMP szacować metodą najmniejszych kwadratów (MNK), jednakże nie zostaną w jego przypadku spełnione klasyczne warunki stosowalności MNK – determinuje to podstawowe wady modelu, do których zalicza się:
Przykładowym równaniem nieliniowym może być znany w ekonomii model (typu) Cobba-Douglasa.
Modele statystyczne dzielą się m.in. na:
Można wyróżnić następujące typy modeli:
Powyższe metody wykorzystywane przy specyfikacji modeli ekonometrycznych są kontrowersyjne a ich naukowość jest kwestionowana.
W praktyce przy doborze zmiennych objaśniających należy kierować się na wstępie zdrowym rozsądkiem i teorią dotyczącą badanego zagadnienia.
Dobór zmiennych zależy również od jakości oszacowania modelu przy danych zmiennych (wykazany brak spełnienia założeń użytej metody estymacji, takie jak dla KMNK heteroskedastyczność, autoregresyjność czy brak rozkładu normalnego reszt, wskazuje na konieczność użycia innego zestawu zmiennych objaśniających). W ten sposób budowa finalnego modelu ma charakter iteracyjny.
Specyficznym przypadkiem są modele trendu, których postać ustalana jest w sposób najbardziej techniczny, na podstawie parametrów dopasowania modelu oraz tak zwanych kryteriów informacyjnych (najbardziej znane z nich: Akaike i Schwarza).
Do estymacji parametrów modelu często stosowane są metody regresji statystycznej.
W celu oceny jakości modelu stosuje się rozmaite testy statystyczne badające jego własności. Dobór testów powinien zależeć od przewidywanego zastosowania modelu (najczęstsze to wyjaśnianie oraz prognozowanie).
Najczęstszym zadaniem testów jest sprawdzenie spełnienia założeń przyjętych w użytej metodzie estymacji (najczęściej dotyczą one rozkładu błędów losowych). Inne testy mają za zadanie ocenę stabilności czy dopasowania modelu.
W szczególności, można wyróżnić następujące własności modelu najczęściej badane za pomocą testów statystycznych:
gdzie:
Współczynnik determinacji informuje o dopasowaniu liniowego modelu regresji do danych empirycznych. Przyjmuje wartości z przedziału jeśli w modelu występuje wyraz wolny, a do estymacji parametrów wykorzystano metodę najmniejszych kwadratów. Im wartość bliższa jedności, tym lepsze dopasowanie.
Kiedy wartość chce się wykorzystać do porównywania jakości kilku modeli, w których liczba zmiennych objaśniających jest różna, stosuje się skorygowany współczynnik determinacji:
gdzie:
Wartość odchylenia standardowego składnika resztowego informuje o przeciętnych odchyleniach wartości rzeczywistych zmiennej prognozowanej od teoretycznych. Im wartości mniejsze, tym lepszy model.
gdzie:
gdzie:
Współczynnik zmienności informuje o tym, jaką część wartości średniej zmiennej objaśnianej stanowi odchylenie standardowe składnika resztowego. Im mniejsza wartość tego współczynnika, tym model jest lepszy.
Badanie istotności parametrów modelu jest próbą stwierdzenia istotności wpływu zmiennych objaśniających na zmienną objaśnianą. Zakładając, że składnik losowy ma rozkład normalny, należy zweryfikować hipotezę o istotności każdego parametru. Nieistotność parametru nie znaczy jednak automatycznie, że zmienną należy usunąć z modelu[2].
gdzie:
Aby sprawdzić prawdziwość hipotezy zerowej wyznacza się statystykę testową:
gdzie:
Wartość wyznacza się ze wzoru:
gdzie:
Błąd
gdzie:
Następnie należy odczytać wartość krytyczną z tablic rozkładu t-Studenta dla zadanego z góry poziomu istotności i stopni swobody. Jeżeli
to hipotezę zerową odrzuca się na rzecz alternatywnej. Jeśli jednak
wtedy nie ma podstaw do odrzucenia hipotezy zerowej.
Wymienione powyżej metody badania jakości modelu są najczęściej stosowanymi.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.