menetelmä tilastolliseen päättelyyn From Wikipedia, the free encyclopedia
Tilastotieteelliseen tutkimukseen kuuluu hypoteesien tekeminen, ja tätä kautta tilastollisen hypoteesin testaus. Tilastollinen hypoteesi on perusjoukkoa koskeva väite, jonka todenperäisyyttä arvioidaan todennäköisyyksien avulla. Tilastollisen testin lähtökohtana on muodostaa nollahypoteesi ja vastahypoteesi. Nollahypoteesi H0 yleensä vastaa tilannetta että verrattavien perusjoukkojen välillä ei ole mitään eroja ja kaikki havaitut poikkeamat näiden välillä on vain sattumaa. Yleensä nollahypoteesi on muotoa ”ei vaikutusta” tai ”ei eroa”. Nollahypoteesin vastahypoteesi H1 on H0:n antiteesi. Yleensä vastahypoteesi on muotoa ”on vaikutusta” tai ”on eroa”. Tutkittavaa ilmiötä mallinnetaan nollahypoteesin mukaisesti ja katsotaan ovatko tämän seuraukset mielekkäitä.[1]
Yleensä nollahypoteesi halutaan kumota, koska ”ei eroavuutta” ei pidetä kiinnostavana tuloksena. H0:aa pidetään työhypoteesina, joka valitaan testaamisen lähtökohdaksi teknisen helppoutensa takia. Mikä kuvaa, että verrattavilla perusjoukoilla ei ole mitään eroa ja kaikkien havaintojen oletetaan olevan samasta jakaumasta, mikä on teoreettisesti yksinkertaista. Jos lähtökohta johtaa epäuskottaviin tuloksiin, niin tulee epäilys nollahypoteesin mielekkyydestä ja vastahypoteesi saa tukea.[1]
Nollahypoteesin uskottavuutta mitataan testin havaitulla merkitsevyystasolla eli p-arvolla. Perinteisesti testeissä on etukäteen asetettu ”riskitaso” α jota pienemmät P-arvot johtavat H0:n hylkäämiseen. Empiirisessä tutkimuksessa yleensä käytetty raja on 5%. Nollahypoteesin kumoavaa havaintoa kutsutaan tilastollisesti merkitseväksi.[1]
Hypoteesit aina viittaavat johonkin populaatioihin tai malleihin, eikä tiettyyn tulokseen, siksi H0 ja H1 täytyy aina esittää perusjoukon parametreina.[2]
H1 esittää vaikutusta mihin etsitään näyttöä, siksi tämä usein valitaan ensin, H0 sen sijaan kuvaa, että haluttua vaikutusta ei tapahdu. H1:n valinta on usein vaikeampi tehtävä, sillä ei ole aina varmaa eroavatko parametrit nollahypoteesin arvosta tiettyyn suuntaan vai molempiin, eli kuuluuko vastahypoteesin olla yksi- vai kaksisuuntainen.[1] Kuitenkin joidenkin tilastotieteilijöiden mielestä tulisi aina käyttää kaksisuuntaista vaihtoehtoa[2].
Vastahypoteesi ilmaisee toiveita tai epäilyjä joita viedään aineistoon. Havaittu aineisto ei saa vaikuttaa testattavien hypoteesien tai vastahypoteesien asettamiseen, vaan hypoteesit on kiinnitettävä ennen datan katselua.[2] Näkyvän poikkeavuuden poimiminen testattavaksi rikkoo riippumattomuusperiaatetta[1].
Tilastollinen testi määrittelee merkitsevyyden aineiston näytön perusteella nollahypoteesia vastaan. Nämä neljä askelta ovat yleiset kaikille merkitsevyystesteille.[2]
Nollahypoteesin hylkäykseen voi liittyä kahta virhettä
Suurissa aineistoissa voidaan haluta tutkia miljoonia hypoteeseja. Yksi vaihtoehto monitestaukseen on virheellisten löydösten osuus (FDR).
Bayes-tilastotieteessä bayes-tekijän käyttö on bayesilainen vaihtoehto frekventistisen (klassisen) tilastotieteen hypoteesin testaukselle. H0 ja H1 ovat hypoteesit, joita testataan.
Prioritodennäköisyyksillä määritellään priorivedonlyöntisuhde
Tämä kuvaa kuinka paljon uskotaan hypoteesiin H0 suhteessa H1 a priori.
Posterioritodennäköisyyksillä määritellään posteriorivedonlyöntisuhde
Tämä kuvaa kuinka paljon uskotaan hypoteesiin H0 suhteessa H1 havainnon y jälkeen.
Bayes-tekijäksi sanotaan suhdetta
B on vedonlyöntisuhde H0:n puolesta H₁:tä vastaan johtuen datasta y. Kun B>1, niin H0 saa enemmän tukea, jos taas B<1 niin H1 saa tukea.[3]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.