From Wikipedia, the free encyclopedia
Statistička hipoteza, ponekad nazvana potvrdnom analizom podataka, hipoteza je koja se može testirati na osnovu posmatranja procesa koji se modeluje pomoću skupa randomnih promenljivih.[1] Test statističke hipoteze je metoda statističkog zaključivanja. Obično se upoređuju dva skupa statističkih podataka ili se upoređuje skup podataka dobijen uzorkovanjem sa sintetičkim skupom podataka iz idealizovanog modela. Predlaže se hipoteza za statistički odnos između dva skupa podataka, i to se upoređuje kao alternativa idealizovanoj nultoj hipotezi koja ne predlaže odnos između dva skupa podataka. Upoređivanje se smatra statistički značajnim ako je odnos između skupa podataka malo verovatna realizacija nulte hipoteze prema graničnoj verovatnoći - nivou značaja. Testovi hipoteze koriste se kada se određuje koji bi rezultati studije doveli do odbacivanja nulte hipoteze za unapred određeni nivo značaja.
Proces razlikovanja nulte hipoteze i alternativne hipoteze je potpomognut razmatranjem dva konceptualna tipa grešaka. Prvi tip greške nastaje kada je nulta hipoteza pogrešno odbačena. Do drugog tipa greške dolazi kada nulta hipoteza pogrešno nije odbačena. (Ova dva tipa su poznata kao greške tipa 1 i tipa 2.)
Testovi hipoteze zasnovani na statističkoj značajnosti su još jedan način izražavanja intervala poverenja (tačnije, skupova poverenja). Drugim rečima, svaki test hipoteze zasnovan na značaju može se dobiti putem intervala poverenja, i svaki interval poverenja može se dobiti putem testa hipoteze zasnovanog na značaju.[2]
Testiranje hipoteza zasnovano na značaju najčešći je okvir za statističko testiranje hipoteza. Alternativni okvir za testiranje statističke hipoteze je da se odredi skup statističkih modela, po jedan za svaku razmatranu hipotezu, i da se zatim koristite tehnike odabira modela za odabir najprikladnijeg modela.[3] Najčešće tehnike odabira zasnivaju se na Akajkovom kriterijumu informacija[4] ili na Bajesovom faktoru.[5][6][7]
U statističkoj literaturi testiranje statističkih hipoteza igra fundamentalnu ulogu.[8] Uobičajeni pristup je sledeći:
Često se koristi jedan alternativni proces:
Ova dva procesa su ekvivalentna.[9] Prvi postupak je imao prednost u prošlosti kada su bile dostupne samo tabele testnih statistika na uobičajenim pragovima verovatnoće. To je omogućavalo donošenje odluke bez izračunavanja verovatnoće. Taj postupak je bio adekvatan za upotrebu u nastavi, i pri operativnoj primeni, mada je on deficitaran u pogledu prijavljivanja rezultata. Potonji se proces oslanjao na opsežne tabele ili na računsku podršku koja nije uvek dostupna. Eksplicitno izračunavanje verovatnoće je koristno pri izveštavanju. U današnje vreme se ovi proračuni rutinski izvode odgovarajućim softverom.
Razlika između ova dva procesa je ilustrovana na primeru radioaktivnog kofera (ispod):
Prvi izveštaj je adekvatan, drugi daje detaljnije objašnjenje podataka i razlog zašto se kofer proverava.
Važno je da se uoči razlika između prihvatanja nulte hipoteze i jednostavnog neuspeha da se odbaci. Terminologija „neuspeh da se odbaci” naglašava činjenicu da se od početka ispitivanja pretpostavlja da je nulta hipoteza tačna; ako nema dokaza protiv nje, jednostavno se i dalje pretpostavlja da je tačna. Fraza „prihvatiti nultu hipotezu” može da sugeriše da je dokazana naprosto zato što nije opovrgnuta. To je logična zabluda poznata kao argument iz neznanja. Osim ako se ne koristi test sa posebno velikom moći, ideja o „prihvatanju” nulte hipoteze može biti opasna. Uprkos toga ta terminologija je prevalentna u statistici, gde se zapravo razume značenje.
Ovde opisani procesi su sasvim adekvatni za računanje. Oni doduše ozbiljno zanemaruju razmatranja dizajna eksperimenata.[10][11] Posebno je kritično da se pre sprovođenja eksperimenta procene odgovarajuće veličine uzorka.
Frazu „test značaja” skovao je statističar Ronald Fišer.[12]
-vrednost je verovatnoća da će se dati rezultat (ili značajniji result) javiti pod nultom hipotezom. Na primer, recimo da se testira poštenost bacanja novčića (nulta hipoteza). Na nivou značaja od 0,05, očekuje se (pogrešno) da se bacanjem novčića odbaci nulta hipoteza u otprilike 1 od svakih 20 testova. -vrednost ne daje verovatnoću da je bilo koja hipoteza tačna (što je čest izvor konfuzije).[13]
Ako je -vrednost manja od izabranog praga značaja (ili ekvivalentno, ako je posmatrana vrednost testne statistike u kritičnoj regiji), tada se kaže da se nulta hipoteza odbacuje na izabranom nivou značaja. Odbacivanje nulte hipoteze je zaključak. Ovo je poput presude „krivice” u krivičnom postupku: dokazi su dovoljni da odbaci nevinost i tako dokaže krivica. Moguće je da postoji mogućnost prihvatanja alternativne hipoteze (i istraživačke hipoteze).
Ako -vrednost nije manja od izabranog praga značaja (ili ekvivalentno, ako je posmatrana vrednost testne statistike izvan kritičnog regiona), tada je dokaz nedovoljan da potvrdi zaključak. (Ovo je slično presudi „nije kriv”.) Istraživač obično dodatno razmatra slučajeve gde je -vrednost blizu nivoa značaja.
Okvir za testiranje hipoteza je analogan matematičkom dokazu kontradikcijom.[14]
U primeru gospođe koja degustira čaj (dole), Fišer je zahtevao od gospođe da pravilno kategoriše sve šoljice čaja kako bi opravdao zaključak da rezultat verovatno neće biti slučajan. Njegov test je otkrio da ako dama efektivno nasumično nagađa (nulta hipoteza), postoji šansa od 1,4% da će se dogoditi uočeni rezultati.
Da li odbacivanje nulte hipoteze zaista opravdava prihvatanje istraživačke hipoteze je zavisno od strukture hipoteza. Odbacivanje hipoteze da veliki otisak šape potiče od medveda ne dokazuje odmah postojanje Bigfuta. Testiranje hipoteza naglašava odbacivanje, koje se zasniva na verovatnoći, pre nego na prihvatanju, što zahteva dodatne logičke korake.
„Verovatnoća odbacivanja nulte hipoteze je funkcija pet faktora: da li je test jedno- ili dvostruko repan, nivo značajnosti, standardna devijacija, količina devijacije od nulte hipoteze, i broj opažanja.”[15] Ovi faktori su izvor kritika; faktori pod kontrolom eksperimentatora/analitičara daju rezultatima izgled subjektivnosti.
Statistika je korisna u analizi većine kolekcija podataka. To važi i za testiranje hipoteza koje mogu opravdati zaključke čak i kada ne postoji naučna teorija. U primeru gospođine degustacije čaja bilo je „očigledno” da ne postoji razlika između (mleko usutog u čaj) i (čaja usutog u mleko). Podaci su bili u suprotnosti sa „očiglednim”.
Primene testiranja hipoteza u stvarnom svetu obuhvataju:[16]
Statističko testiranje hipoteza ima važnu ulogu u celokupnoj statistici i u statističkom zaključivanju. Na primer, Lehman (1992) u pregledu fundamentalnog rada Nejmana i Pirsona (1933) kaže: „Ipak, uprkos njihovih nedostataka, nova paradigma formulisana u dokumentu iz 1933. godine, i mnoštvo razvoja sprovedeno u okviru nje nastavljaju da igraju centralnu ulogu i u teoriji i u praksi statistike, i može se očekivati da će to činiti i u doglednoj budućnosti”.
Testiranje značajnosti bilo je preferentno statističko sredstvo u nekim eksperimentalnim društvenim naukama (preko 90% članaka u časopisu Primenjena psihologija () tokom ranih 1990-ih).[17] Ostala polja favorizuju procenu parametara (npr. veličinu efekta). Testiranje značajnosti koristi se kao zamena za tradicionalno upoređivanje predviđene vrednosti i eksperimentalnih rezultata u srži naučne metode. Kada je teorija može da predvidi samo znak veze, test usmerene (jednostrane) hipoteze može da bude konfigurisan tako da samo statistički značajan rezultat podržava teoriju. Ovaj oblik ocenjivanja teorije najoštrije je kritikovana primena testiranja hipoteza.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.