From Wikipedia, the free encyclopedia
Inferentzia estatistikoan, errore estandarra zenbatesle baten desbideratze estandarra da. Maiz lagin batezbestekoa eta proportzioa zenbatesletzat hartzean erabiltzen da, zenbatesle horiek populazio batezbestekoari eta populazio proportzioari buruz alboragabe edo zentratuak direnez, haien desbideratze estandarrak, errore estandarrak alegia, parametroari buruz puntu-zenbatespen bat egitean sortzen den batez besteko errorea adierazten baitu. Errore estandarra txikitu egiten da lagin-tamainua handitu ahala.
Inferentzia estatistikoan, errore estandarra (EE) zenbatesle baten desbideratze estandarra da[1]. Beste hitz batzuekin esanda, populazio beraren laginak behin eta berriz hartuz gero laginaren batez bestekoa zenbat alda daitekeen kalkulatzen du.
Laginaren batez bestekoa populazioaren batez bestekoaren ohiko zenbateslea da. Hala ere, populazio beraren lagin desberdinek, oro har, laginen batez bestekoen balio desberdinak ematen dituzte. Batez bestekoaren errore estandarra (hau da, populazioaren batez bestekoa laginen batez bestekoetatik kalkulatzearen ondoriozko errorea) populazio horretatik aukeratutako balizko lagin guztien (tamaina jakin batekoak) desbideratze estandarra da[2]. Gainera, batez bestekoaren errore estandarra desbideratze estandarraren zenbatespen bati buruzkoa izan daiteke, aldi berean aztertzen ari den datu-lagin batetik kalkulatuta.
Aplikazio praktikoetan, desbideratze estandarraren (edo errorearen) benetako balioa ezezaguna da. Emaitza gisa, "errore estandarra" terminoa kopuru ezezagun horren zenbatespen bati erreferentzia egiteko erabiltzen da batzuetan. Kasu horietan, garrantzitsua da argi izatea nondik datorren, errore estandarra zenbatespen bat baino ez baita. Zoritxarrez, hori ez da beti posiblea, eta hobe izan daiteke errore estandarra erabiltzen saihestea, hurbilketa bat erabiliz, adibidez, egiantz handieneko estimazioa edo konfiantza-tarteetatik eratorritako hurbilketa formalago bat erabiltzea. Kasu ezagun bat zeinetan hurbilketa bat erabiltzen den, Student banaketa da, batez besteko estimatu baterako konfiantza-tartea edo batez bestekoen arteko aldea emateko. Beste kasu batzuetan, errore estandarra ziurgabetasunaren tamaina adierazteko erabil daiteke, baina konfiantza-tarteak emateko haren erabilera formala edo erdi-formala saihestu egin behar da, laginaren tamaina gutxienez neurriz handia ez bada behintzat. “Handia" kontzeptua aztertuko diren kantitate partikularren araberakoa izango da.
Erregresio-analisian, errore estandarra edo errore tipikoa terminoa minimo karratuen zenbatespenaren eta laginean emandako balioen arteko desberdintasunen batez besteko gisa ere erabiltzen da[3].
Batez bestekoaren errore estandarraren eta desbideratze estandarraren arteko erlazioa hain handia da, ezen, laginaren tamaina jakin baterako, batez bestekoaren errore estandarra laginaren tamainaren erro karratuaz zatitutako desbideratze estandarraren berdina baita[4].
Batez bestekoaren errore estandarra () kalkulatzeko, populazioaren desbideratze estandarra (σ) laginaren tamainaren (n) erro karratuarekin zatitzen da. Batez bestekoaren errore estandarra kalkulatzeko formula orokorra hurrengoa da[5]:
Non,
Errore estandarra funtsezkoa da inferentzia estatistikoan, laginen zenbatespenen zehaztasuna neurtzen baitu. Errore estandarra zenbat eta txikiagoa izan, orduan eta handiagoa izango da laginaren batez bestekoaren estimazioaren zehaztasuna, populazioaren batez bestekoarekin alderatuta. Hori erabakigarria da datuetan oinarritutako erabaki informatuak hartzeko eta laginaren emaitzak populazio osoari orokortzeko[6].
Populazioaren desbideratze estandarra (σ) oso gutxitan ezagutzen denez, hurbilketa bat egitean da, zeinetan, laginaren desbideratze estandarra (s) laginaren tamainaren (n) erro karratuagatik zatitzen den, batez bestekoaren errore estandarraren balore estimatua lortuz. Hau egiteko, laginaren balioen independentzia estatistikoa suposatu behar da:
Non,
Garrantzitsua da errore estandarra eta desbideratze estandarra bereiztea. Desbideratze estandarrak lagin baten barruko datuen sakabanaketa neurtzen duen bitartean, errore estandarrak laginaren batez bestekoaren zenbatespenaren zehaztasuna neurtzen du, populazioaren batez bestekoarekin alderatuta. Laburbilduz, desbideratze estandarrak lagin baten barruko aldakortasuna deskribatzen du, eta errore estandarrak, berriz, lagin anitzen arteko aldakortasuna. Oro har, errore estandarrak lotura zuzena du laginaren tamainarekin. Laginaren tamaina handitu ahala, errore estandarrak behera egiten du, eta horrek laginaren batez bestekoaren estimazioan zehaztasun handiagoa adierazten du. Beraz, funtsezkoa da kontuan hartzea laginaren tamaina errore estandarra interpretatzean; lagin handiagoek populazioaren batez bestekoaren zenbatespen zehatzagoak emateko joera dutelako[7].
Laginaren tamaina txikia denean, laginaren desbideratze estandarra (s) erabiltzeak, populazioaren desbideratze estandar errealaren (σ) ordez, populazioaren desbideratze estandarra eta, beraz, errore estandarra sistematikoki gutxiestera joko du. Adibidez, n = 2-rekin, gutxiespena % 25 ingurukoa da, baina n = 6-ren kasuan, gutxiespena % 5ekoa baino ez da.
Hau konpontzeko, Gurlandek eta Tripathik (1971) zuzenketa ekuazio bat eman zuten efektu honetarako[8]:
Non,
Bestalde, Sokalek eta Rohlfek (1981) n < 20-ko lagin txikietarako zuzenketa-faktorearen ekuazioa proposatu zuten[9]:
Non,
k-ren balioa aldatu daiteke ereduaren konplexutasunaren eta barne hartzen dituen aldagai kopuruaren arabera. Adibidez, erregresio lineal sinpleko eredu batean, kalkulatutako parametro-kopurua 2 izango litzateke (bat maldarako eta beste bat termino konstanterako). Hala ere, eredu konplexuago batean, hainbat aldagai dituen erregresio anitzeko eredu bat bezala, orduan k-ren balioa handiagoa izango litzateke.
Erregresioaren errore estandarra (), estimazioaren errore estandarra bezala ere ezagutzen dena, erregresio eredu batean parametroen estimazioen zehaztasunaren neurketa bat da[10]. Erregresio-lerro doituaren inguruan mendeko aldagaiaren zenbatespena zenbat aldatzen den ebaluatzeko erabiltzen da normalean. Ereduaren hondakinen desbideratze estandarra erabiliz kalkulatzen da, hurrengo formula erabiliz[11]:
Non,
Erregresioaren errore estandarra erabakigarria da erregresio-ereduaren zehaztasuna ebaluatzeko eta ereduaren parametroei buruzko inferentziak egiteko[12]. Erregresio baxuko errore estandar batek parametroen zenbatespenak zehatzak eta fidagarriak direla adierazten du; errore estandar altu batek, berriz, zenbatespenak ez direla hain fidagarriak iradokitzen du. Erregresioaren errore estandarra banaketa normaletako desbideratze estandarraren antzera interpretatzen da. Zenbat eta txikiagoa izan erregresioaren errore estandarra, orduan eta zehatzagoak izango dira ereduaren parametroen zenbatespenak. Beraz, garrantzitsua da erregresioaren errore estandarra kontuan hartzea erregresio-analisi baten emaitzak interpretatzean eta eredu desberdinen arteko konparazioak egitean[13].
Erregresioaren errore estandarra hainbat aplikaziotan erabiltzen da, datu ekonomikoen analisian, merkatu-azterketan eta gizarte eta osasun zientzietan, bestak beste. Adibidez, ekonometrian, erregresioaren errore estandarra koefizienteen zenbatespenen zehaztasuna erregresio ekonomikoko ereduetan ebaluatzeko erabiltzen da.
Aplikazio praktiko askotan, σ-ren benetako balioa ezezaguna da. Horren ondorioz, banaketa bat erabili behar dugu, eta banaketa horrek kontuan hartu behar du gerta daitezkeen σ-ren dispertsioa. Banaketa gaussiarra denean, nahiz eta σ ezezaguna izan, orduan, ondoriozko banaketa zenbatetsiak Student t banaketa jarraitzen duela esaten da[14]. Student t banaketak eta banaketa gaussiarra zertxobait desberdinak dira eta laginaren tamainaren arabera aldatzen dira. Lagin txikiek joera handiagoa dute populazioaren desbideratze estandarra gutxiesteko eta populazioaren batez besteko errealarekin bat ez datorren batez bestekoa izateko. Kasu hauetan, Student t banaketa erabiltzen da, honek kontuan hartzen duelako cola astunagoak dituzten gertaera horien probabilitatea.
Laburbilduz, Student t banaketa lagin txikiekin lan egiten denean (n < 30) edo populazioaren desbideratze estandarra ezezaguna denean erabiltzen da. Banaketa normal estandarraren alternatiba bat da, hori lagin handiekin lan egiten denean edo populazioaren desbideratze estandarra ezaguna denean erabiltzen delako. Student t banaketa baten errore estandarra kalkulatzeko, nahikoa da "s" laginaren desbiderapen estandarra erabiltzea, eta balio hori erabil genezake konfiantza-tarteak kalkulatzeko[15]. Kasu honetan, errore estandarraren kalkulua doitu egiten da apur bat t banaketa kontuan hartzeko. Formula doitua hau da:
Non,
t kalkulatzeko, konfiantza-maila bat eta askatasun-gradu kopurua zehaztu behar dituzu. t balio kritikoa Student t banaketaren tauletan aurki daiteke, edo estatistika-software-a erabiliz ere kalkula daiteke[16].
Errore estandarra hainbat testuingurutan erabiltzen da, iritzi publikoari buruzko inkestak egitean[17], ikerketa zientifikoan[18] eta datuen azterketetan[19], besteak beste. Adibidez, azterketa klinikoetan, errore estandarra tratamenduaren estimazioen zehaztasuna ebaluatzeko eta emaitzak estatistikoki esanguratsuak diren zehazteko erabiltzen da[20].
Erabilitako datuak banaketa normala jarraitzen dutela onartzen bada, banaketa normalaren kuantilak, laginaren batez bestekoa eta errore estandarra, batez bestekorako gutxi gorabeherako konfiantza-tarteak kalkulatzeko erabil daitezke. Honako adierazpen hauek erabil daitezke % 95eko konfiantza-mugak kalkulatzeko:
Non, laginaren batez bestekoaren den, laginaren batez bestekoaren errore estandarra den, eta 1.96 balioa banaketa normal estandarraren 0.975 kuantilari dagokio, normalean % 95eko konfiantza-tarteetan erabiltzen dena.
Errore estandarrek ziurgabetasunaren neurri sinpleak ematen dituzte, eta sarritan erabiltzen dira hainbat arrazoirengatik:
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.