Në teorinë dhe statistikat e probabilitetit, varianca ose dispersioni është shamngia në katror nga mesatarja e një ndryshoreje rasti . Varianca shpesh përkufizohet gjithashtu si katrori i devijimit standard . Varianca është një matëse e shpërndarjes, që do të thotë se është një matëse se sa larg është shpërndarë një grup numrash nga vlera e tyre mesatare. Është momenti i dytë qendror i një shpërndarjeje, dhe kovarianca e ndryshores së rastësishme me vetveten, dhe shpesh përfaqësohet nga , , , , ose . [1]
Një avantazh i dispersionit si masë e shpërndarjes është se është më i përshtatshëm për manipulimin algjebrik sesa masat e tjera të shpërndarjes, siç është devijimi absolut i pritur; për shembull, varianca e një shume ndryshoresh rasti të pakorreluara është e barabartë me shumën e variancave të tyre. Një disavantazh i dispersionit në zbatime praktike është se, ndryshe nga devijimi standard, njësitë e tij ndryshojnë nga ajo e n.r, kjo është arsyeja pse devijimi standard raportohet më shpesh si një masë e shpërndarjes pasi përfundon llogaritja.
Ka dy koncepte të ndryshme që emërtohen të dyja "variancë". Njëra, siç u diskutua më lart, është pjesë e një shpërndarjeje teorike probabiliteti dhe përcaktohet nga një ekuacion. Varianca tjetër është një karakteristikë e një grupi vëzhgimesh. Kur varianca llogaritet nga vëzhgimet, ato vëzhgime zakonisht maten nga një sistem i botës reale. Nëse të gjitha rezultatet e mundshme të sistemit janë të pranishme, atëherë varianca e llogaritur quhet variancë e popullsisë. Normalisht, megjithatë, vetëm një nëngrup është i gatshëm dhe varianca e llogaritur nga kjo mënyrë quhet variancë e mostrës. Varianca e llogaritur nga një kampion konsiderohet si një vlerësim i variancës së plotë të popullsisë. Ka shumë mënyra për të llogaritur një vlerësim të variancës së popullsisë, siç diskutohet në seksionin më poshtë.
Varianca e një ndryshoreje rasti është vlera e pritur e devijimit nga mesatarja në katror e , :
Ky përkufizim përfshin ndryshore rasti që krijohen nga procese që janë diskrete, të vazhdueshme, as ose të përziera. Varianca mund të konsiderohet gjithashtu si kovarianca e një ndryshoreje të rastësishme me vetveten:
Një tjetër formulë për dispersionin merret si më poshtë:
Me fjalë të tjera, varianca e X është e barabartë me mesataren e n.r të ngritur në katror minus katrorin e mesatares së . Ky ekuacion nuk duhet të përdoret për llogaritjet duke përdorur aritmetikën me pikë lundruese, sepse vuan nga anulimi katastrofik nëse dy komponentët e ekuacionit janë të ngjashëm në madhësi. Për alternativa të tjera numerikisht të qëndrueshme, shihni Algoritmet për llogaritjen e variancës .
Ndryshore e rastit diskrete
Nëse ndryshorja e rastit është diskrete me funksion mase probabiliteti , atëherë
ku është vlera e pritur. Kjo është,
Varianca e një bashkësie të vlerash njëlloj të mundshme shkruhet edhe si:
ku është vlera mesatare. Kjo është,
Ndryshoret e rastit absolutisht të vazhdueshme
Nëse ndryshorja e rastit ka një funksion të densitetit të probabilitetit , dhe është funksioni përkatës i shpërndarjes mbledhëse, atëherë
në intervalin [0, ∞ ) . Mesatarja e kësaj shpërndarje mund të tregohet se është
Duke përdorur integrimin me pjesë dhe duke përdorur pritje matematike tashmë të llogaritur, ne kemi:
Kështu, varianca e jepet nga
Zari i drejtë
Hedhja e një zari të drejtë mund të modelohet si n.r diskrete, , me rezultate nga 1 deri tek 6, secila me probabilitet të njëjtë 1/6. Pritja matematike e është Kështu që, varianca e është
Shpërndarjet e probabilitetit të përdorura zakonisht
Varianca është jo negative sepse madhësitë e ngritura në katror janë gjithmonë pozitive ose zero:
Varianca e një konstante është zero.
Çështja e pafundësisë
Nëse një shpërndarje nuk ka pritje matematike të fundme, siç është rasti për shpërndarjen Cauchy, atëherë edhe varianca nuk mund të jetë e fundme. Megjithatë, disa shpërndarje mund të mos kenë një variancë të fundme, pavarësisht se pritja matematike është e fundme. Një shembull i tillë është një shpërndarje Pareto, indeksi i së cilës plotëson kushtin
Njësitë matëse
Ndryshe nga devijimi absolut i pritur, varianca e një ndryshore ka njësi që janë katrori i njësive të vetë ndryshores. Për shembull, një ndryshore e matur në metra do të ketë një variancë të matur në metra katrorë. Për këtë arsye, përshkrimi i grupeve të të dhënave nëpërmjet devijimit të tyre standard ose devijimit mesatar katror nën rrënjë shpesh preferohet ndaj përdorimit të variancës. Në shembullin e zareve, devijimi standard është , pak më i madh se devijimi absolut i pritur, 1.5.
Mbledhja dhe shumëzimi me një konstante
Varianca është e pandjeshme ndaj ndryshimeve në një parametër vendndodhjeje . Kjo do të thotë se nëse një konstante u shtohet të gjitha vlerave të ndryshores, varianca mbetet e pandryshuar:
Nëse të gjitha vlerat shkallëzohen me një konstante, varianca shkallëzohet me katrorin e asaj konstante:
Varianca e shumës së dy ndryshoreve të rastit jepet nga barazimi
Në përgjithësi, për shumën e ndryshoreve të rastit , varianca gjendet si:
Këto rezultate çojnë në variancën e një kombinimi linear të gjetur si:
Nëse ndryshoret e rastit janë të tilla që
atëherë thuhet se janë të pakorreluara . Kështu që për to mund të shkruhet:
Prodhimi ndryshoreve
Prodhimi i ndryshoreve të pavarura
Nëse dy ndryshore dhe janë të pavarura, varianca e prodhimit të tyre jepet nga [2]
Në mënyrë të njëvlerëshme, duke përdorur vetitë themelore të pritjes matematike, ajo jepet nga
Produkt i ndryshoreve statistikisht të varura
Vëzhgimet e botës reale të tilla si matjet e shiut të djeshëm gjatë gjithë ditës zakonisht nuk mund të jenë grupe të plota të të gjitha vëzhgimeve të mundshme. Si e tillë, varianca e llogaritur nga bashkësia e fundme në përgjithësi nuk do të përputhet me variancën që do të ishte llogaritur nga popullata e plotë e vëzhgimeve të mundshme. Kjo do të thotë që vlerësohet mesatarja dhe varianca nga një bashkësi e kufizuar vëzhgimesh duke përdorur një ekuacion vlerësues . Vlerësuesi është një funksion i zgjedhjes së vëzhgimeve të nxjerra pa paragjykime vëzhguese nga e gjithë popullata e vëzhgimeve të mundshme. Në këtë shembull ajo zgjedhje do të ishte grupi i matjeve të reshjeve të djeshme nga matësat në gatishmëri.
Vlerësuesit më të thjeshtë për mesataren e popullsisë dhe variancën e popullsisë janë thjesht mesatarja dhe varianca e zgjedhjes/kampionit, mesatarja e zgjedhjes dhe varianca (e pakorrigjuar) e zgjedhjes- këta janë vlerësues të qëndrueshëm (ata konvergjojnë në vlerën e saktë teksa numri i zgjedhjeve rritet), por mund të të përmirësohet. Vlerësimi i variancës së popullatës duke marrë variancën e zgjedhjes është afër optimales në përgjithësi, por mund të përmirësohet në dy mënyra. Më thjeshtë, varianca e kampionit llogaritet si një mesatare e devijimeve në katror rreth mesatares (së kampionit), duke e pjesëtuar me . Megjithatë, përdorimi i vlerave të tjera përveç përmirëson vlerësuesin në mënyra të ndryshme. Katër vlera për emëruesin janë ,, , dhe : është më e thjeshta (varianca e popullsisë së kampionit), eliminon paragjykimet, minimizon gabimin mesatar në katror për shpërndarjen normale, dhe më së shumti eliminon zjvendosjet/anësinë në vlerësimin e paanshëm të devijimit standard për shpërndarjen normale.
Varianca e popullsisë
Në përgjithësi, varianca e popullsisë së një popullate të fundme me madhësi me vlera jepet nga
ku mesatarja e popullësisë është
Varianca e popullsisë gjithashtu mund të llogaritet duke përdorur
Varianca e kampionit
Varianca e pazhvendosur e kampionit
Në shumë situata praktike, varianca e vërtetë e një popullate nuk dihet apriori dhe duhet të llogaritet sipas ndonjë mënyre. Kur kemi të bëjmë me popullata jashtëzakonisht të mëdha, nuk është e mundur të numërohet çdo objekt i popullatës, kështu që llogaritja duhet të kryhet në një zgjedhje të popullsisë. [3] Kjo zakonisht quhet variancë e zgjedhjes ose variancë empirike . Varianca e zgjedhjes mund të zbatohet gjithashtu për vlerësimin e variancës së një shpërndarjeje të vazhdueshme nga një kampion i asaj shpërndarjeje.
Marrim një kampion me zëvendësim të vlerave nga popullsia, ku , dhe vlerësojmë variancën në bazë të këtij kampioni. [4] Marrja e drejtpërdrejtë e variancës së të dhënave të mostrës jep mesataren e devijimeve në katror:
Këtu, tregon mesataren e mostrës:
Meqenëse Yi zgjidhen rastësisht, të dyja dhe janë ndryshore të rastit. Pritjet matematike të tyre mund të vlerësohen duke marrë një mesatare mbi grupin e të gjitha kampioneve të mundshme me madhësi n nga popullata. Për kjo jep:
Prandaj jep një vlerësim të variancës së popullatës që është e njëanshme/ e zhvendosur me një faktor prej . Per kete arsye, referohet si varianca e mostrës së njëanshme .
Varianca e pazhvendosur e zgjedhjes
Korrigjimi për këtë anësi jep variancën e pazhvendosur të mostrës, të shënuar :
Secili vlerësues mund të referohet thjesht si varianca e kampionit kur versioni mund të përcaktohet nga konteksti.
Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. fq.51. ISBN9781441923226.{{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)