Cauchy-jakauma (Cauchyn jakauma) on Augustin Cauchyn mukaan nimetty jatkuva todennäköisyysjakauma. Varsinkin fysikaalisissa sovelluksissa sitä nimitetään myös Lorentzin jakaumaksi (Hendrik Lorentzin mukaan),[1] Cauchyn–Lorentzin jakaumaksi tai Breitin–Wignerin jakaumaksi. Yksin­kertaisinta Cauchy-jakaumaa sanotaan standardiksi Cauchy-jakaumaksi. Sen tiheysfunktio on

Pikafaktoja Parametrit, Määrittelyjoukko ...
Cauchy-jakauma
Tiheysfunktio
Thumb
Kertymäfunktio
Thumb
Parametrit lokaatio (reaaliluku)
γ > 0 skaala (reaaliluku)
Määrittelyjoukko
Tiheysfunktio
Kertymäfunktio
Odotusarvo ei ole
Mediaani
Moodi
Varianssi ei ole
Vinous ei määritelty
Huipukkuus ei määritelty
Entropia
Momentit generoiva funktio ei ole
Karakteristinen funktio
Sulje

ja sen kertymäfunktio on arkustangenttifunktion muotoinen:

.

Kahden standardin normaalisti jakautuneen satunnaismuuttujan suhde noudattaa standardia Cauchy-jakaumaa.[2]

Cauchy-jakauma on siitä erikoinen, että sillä ei ole odotusarvoa eikä varianssia. Tämän vuoksi eräät toden­näköisyys­laskennan tärkeät tulokset kuten suurten lukujen laki ja keskeinen raja-arvolause eivät koske Cauchy-jakaumaa noudattavia satunnais­muuttujia. Koska sillä ei ole odotus­arvoa, sillä ei ole myöskään momentit generoivaa funktiota.[3]

Cauchy-jakauma on yksi harvoista vakaista jakaumista, joiden tiheysfunktio voidaan ilmaista analyyttisesti; muita sellaisia ovat normaalijakauma ja Lévyn jakauma.

Historia

Matemaatikot tutkivat Cauchy-jakauman muotoisia funktioita jo 1700-luvun alussa, mutta toisenlaisessa yhteydessä. Tuolloin niistä käytettiin nimitystä Agnesin noita.[1] Jakauman nimestä huolimatta ensimmäisen tutkielman sen ominaisuuksista jakaumana julkaisi ranskalainen matemaatikko Siméon Denis Poisson vuonna 1824; Cauchyn nimi liitettiin siihen vasta erään vuonna 1853 käydyn akateemisen väittelyn yhteydessä.[4] Jakauman nimi on siis esimerkki Stiglerin lain toteutumisesta. Poisson totesi, että jos otetaan keskiarvo tätä jakaumaa noudattavista havainnoista, se ei havaintojen lukumäärän kasvaessa suppene mitään äärellistä lukua kohti. Niinpä Laplace oli tehnyt virheen soveltaessaan keskeistä raja-arvolausetta tällaiseenkin jakaumaan, sillä lause edellyttää äärellistä odotus­arvoa ja varianssia. Poisson ei kuitenkaan pitänyt asiaa kovin tärkeänä, toisin kuin Bienaymé, joka myöhemmin kävi Cauchyn kanssa pitkällisen väittelyn asiasta.

Tilanteita, joissa Cauchy-jakauma esiintyy

Normaalisti jakautuneiden satunnaismuuttujien suhde

Jos U ja V ovat kaksi riippumatonta normaalisti jakautunutta satunnaismuuttujaa, joiden odotusarvo on 0 ja varianssi 1, niiden suhde U/V noudattaa standardia Cauchy-jakaumaa. [2]

Suorien leikkauspisteen jakauma

Oletetaan, että tasolla jonkin x-akselin ulkopuolella olevan pisteen kautta piirretään satunnaisesti valittu suora siten, että tämän suoran suuntakulma on tasaisesti jakautunut välille -π/2 ... ­π/2. Tällöin sen pisteen sijainti, jossa tämä suora leikkaa x-akselin, noudattaa Cauchy-jakaumaa.[5]

Tämä voidaan todistaa seuraavasti:

Olkoon θ kulma, jonka y-akselilla olevan pisteen (0,b) kautta kulkeva suora muodostaa y-akselin kanssa. Jos suora leikkaa x-akselin pisteessä (x0, 0), on

,

ja

,

jolloin jos kulma θ on tasaisesti jakautunut välille -π/2; ... π/2;. Leikkaus­pisteen jakauman kertymä­funktion ilmaisee toden­näköisyys, että pisteen x-koordinaatti on pienempi kuin annettu x0. Näin tapahtuu, jos

eli jos

mutta koska θ on tasaisesti jakautunut välille (-π, π), se saa mitä tahansa tällä välillä olevaa arvoa a pienemmän arvon toden­näköisyydellä

,

ja näin ollen arvoa θ0 pienemmän arvon toden­näköisyydellä

,

sillä θ saa nollaa pienemmän arvon toden­näköisyydellä 1/2.

Kyseisen leikkauspisteen sijainnin x-koordinaatin arvo on siis satunnaismuuttuja, jonka kertymä­funktio on

mikä on juuri Cauchy-jakauman Cauchy (0,1) kertymäfunktio.

Jakauman tiheys- ja kertymäfunktio

Tiheysfunktio

Cauchy-jakauman tiheysfunktio on

missä parametri x0 (lokaatioparametri) osoittaa jakauman huipun sijainnin ja γ (skaalaparametri) osoittaa jakauman leveyden, tai tarkemmin sanottuna, millä etäisyydellä jakauman huipusta tiheys­funktion arvo on puolet tästä maksimi­arvosta. Samalla γ on myös puolet jakauman ylä- ja ala­kvartiilien erotuksesta, ja sitä sanotaan joskus todennäköiseksi virheeksi. Augustin-Louis Cauchy käytti vuonna 1827 tästä tiheys­funktiosta sellaistakin muunnosta, jossa skaala­parametri oli infinitesimaalinen, ja täten hän tuli määritellyksi sen, mitä nykyisin sanotaan Diracin deltafunktioksi.

Tiheysfunktion suurin arvo eli jakauman amplitudi on

Siinä erikois­tapauksessa, että x0 = 0 ja γ = 1 saadaan standardi Cauchy-jakauma, jonka tiheysfunktio on

Fysiikassa käytetään usein kolmi­parametrista Lorentzin funktiota:

missä I on huipun korkeus. Tämä kolmi­parametrinen Lorentzin funktio ei yleensä ole toden­näköisyys­tiheys­funktio, sillä sen integraali ei ole 1 paitsi siinä erikois­tapauksessa, että .

Kertymäfunktio

Cauchy-jakauman kertymäfunktio on:

ja sen kvantiilifunktio eli kertymä­funktion käänteisfunktio on

Tästä seuraa, että jakauman ala- ja ylä­kvartiilit ovat x0-γ ja x0+γ),

ja kvartiilien erotus näin ollen 2γ.

Cauchy-jakauman kvantiili­funktion derivaatta eli jakauman kvantiili­tiheys­funktio on:

Jakauman differentiaalinen entropia määritellään sen kvantiili­tiheys­funktion avulla:[6], nimittäin

Ominaisuuksia

Thumb
Cauchy-jakauman (eli Lorentz-jakauman) ja Gaussin normaalijakauman tiheysfunktioiden vertailu, josta ilmenevät edellisen paksummat "hännät".

Cauchy-jakauma on esimerkki jakaumasta, jolla ei ole odotusarvoa, varianssia eikä korkeampia momentteja. Sen sijaan sillä kyllä on hyvin määritelty moodi eli tiheys­funktion maksimi­kohta ja mediaani, jotka molemmat ovat suuruudeltaan x0. Jakauman tiheys­funktion kuvaaja on lisäksi symmetrinen tämän mediaanin suhteen ja muistuttaa muodoltaan normaalijakauman kuvaajaa eli Gaussin käyrää, mutta ei silti toteuta odotus­arvon määritelmän ehtoja. Cauchy-jakauman tiheysfunktio lähestyy kummassakin päässä nollaa oleellisesti hitaammin kuin normaalijakauman; sanotaan, että sillä on paksummat "hännät".

Jos X1, ..., Xn ovat riippumattomia ja identtisesti jakautuneita satunnais­muuttujia, joista jokainen noudattaa standardia Cauchy-jakaumaa, niiden otos­keski­arvo (X1+ ... +Xn)/n noudattaa samaa standardia Cauchyn jakaumaa.[2] Tämä voidaan osoittaa laskemalla keskiarvon karakteristinen funktio:

missä on otos­keski­arvo. Keskeinen raja-arvolause ei siis päde Cauchy-jakaumalle, mutta sillä ei olekaan lauseen edellyttämää äärellistä varianssia, ja näin ollen tämä esimerkki osoittaa, että tämä todella on oleellinen edellytys, jota ei voida jättää huomioon ottamatta. Myöskään suurten lukujen laki ei koske Cauchy-jakaumaa, koska sillä ei ole odotus­arvoa. Cauchy-jakauma on täysin vakaa jakauma.[7]

Standardi Cauchy-jakauma saadaan myös erikois­tapauksena Studentin t-jakaumasta, kun vapausasteita on yksi.[3]

Kuten kaikkien muidenkin vakaiden jakaumien tapauksessa, se lokaatio-skaala-perhe, johon Cauchy-jakauma kuuluu, on suljettu sellaisten lineaaristen muunnosten suhteen, joiden kertoimet ovat reaalilukuja. Lisäksi jakauma­perhe on suljettu reaali­kertoimisten lineaaristen frationaalisten muunnosten suhteen.[8]

Karakteristinen funktio

OlkoonX Cauchy-jakautunut satunnais­muuttuja. Jakauman karakteristinen funktio on[3]

mikä on samalla tiheysfunktion Fourier-muunnos. Alkuperäinen toden­näköisyy­stiheys voidaan esittää karakteristisen funktion avulla oleellisesti käyttämällä käänteistä Fourier-muunnosta:

On huomattava, että karakteristinen funktio ei ole differentioituva origossa: tämä vastaa sitä, että Cauchy-jakaumalla ei ole odotusarvoa.

Miksi odotusarvoa ja momentteja ei voida määrittää

Odotusarvo

Jos todennäköisyysjakaumalla on tiheysfunktio f(x), sen odotusarvo on

Kysymys on nyt siitä, miten määritellään integraali molemmista päistä rajoittamattoman välin yli: onko se sama kuin

jokaisella mieli­valtaisella reaali­luvulla a.

Jos ainakin toinen lausekkeen (2) yhteen­laskettavista on äärellinen, lausekkeet (1) ja (2) ovat yhtä suuret. Mutta Cauchy-jakauman tapauksessa edellinen näistä yhteen­laskettavista on miinus ääretön, jälkimmäinen plus ääretön, eikä niiden summaa voida laskea. Sen vuoksi lauseke (1) ei ole määritelty, eikä Cauchyn jakaumalla sen vuoksi ole odotusarvoa.[9]

Vaikuttaisi ehkä luonnolliselta käsittää lauseke (1) raja-arvoksi

.

Tämä raja-arvo, niin sanottu Cauchyn perusarvo, on nolla. Mutta lausekkeen (1) voitaisiin yhtä hyvin tulkita tarkoittavan myös esimerkiksi raja-arvoa

joka ei ole nolla, mikä voidaan todeta suorittamalla integrointi.

Monet odotus­arvoa koskevat toden­näköisyys­laskennan tulokset kuten vahva suurten lukujen laki eivät tällaisissa tapauksissa päde.[9]

Korkeammat momentit

Cauchy-jakaumalla ei ole minkään asteen äärellisiä momentteja. Jotkin korkeammista raaoista momenteista sillä kyllä on, ja ne ovat äärettömiä, esimerkiksi raaka toinen momentti:

Järjestämällä lauseke uudestaan huomataan, että toinen momentti on oleellisesti vakion, tässä luvun 1, integraali äärettömän välin yli. Myös korkeammat parillisen potenssin raa'at momentit saavat arvon ääretön. Parittoman potenssin raakoja momentteja taas ei voida lainkaan määritellä. Ne nimittäin olisivat oleellisesti sama asia kuin lauseke , sillä lausekkeessa olevat kaksi integraalia, joista toinen vähennetään toisesta, ovat molemmat äärettömiä. Ensimmäinen raaka momentti on sama kuin jakauman odotusarvo, jota tässä tapauksessa ei siis myöskään voida määritellä. Tämä taas merkitsee, että jakaumalle ei voida määritellä myöskään keskeisiä momentteja eikä standardoituja momentteja, sillä ne kaikki määritellään odotusarvon avulla. Samasta syystä Cauchy-jakaumalla ei ole myöskään varianssia, sillä se on sama kuin toinen keskeinen momentti, vaikka sillä onkin toinen raaka momentti, joka on ääretön.

Korkeampia momentteja koskevat tulokset seuraavat Hölderin epäyhtälötä, jonka mukaan alempien momenttien hajaantuessa korkeammatkin momentit hajaantuvat.

Parametrien estimointi

Koska Cauchyn jakauman parametrit eivät vastaa odotusarvoa ja varianssia, Cauchy-jakauman parametreja ei voida estimoida otoksen keskiarvon ja varianssin avulla.[10] Jos esimerkiksi otetaan Cauchy-jakauman mukaisesta aineistosta n otosta, tämän otoksen keskiarvo voidaan laskea:

Vaikka otoksen arvot xi keskittyvät lähelle mediaania x0, otoksen keskiarvo voi vaihdella yhä enemmän sitä mukaa kuin lisää otoksia poimitaan, koska on yhä todennäköisempää, että kohdataan tapauksia, jotka poikkeavat siitä paljon. Itse asiassa otosten keskiarvo noudattaa samaa jakaumaa kuin otokset itsekin, toisin sanoen suuren otoksen keskiarvo ei ole lainkaan parempi, joskaan ei huonompikaan arvio mediaanille x0 kuin mikään yksittäinen otokseen kuuluva havaintokaan. Samoin myös otoksen varianssi kasvaa yhä suuremmaksi, kun lisää otoksia poimitaan.

Siksi mediaanin x0 ja skaalaparametrin γ arvioimiseksi tarvitaan vahvempia menetelmiä. Muuan yksinkertainen keino on käyttää otoksen mediaania x0:n estimaattorina sekä ala- ja yläkrvartiilin erotusta estimaattorina γ:lle. Muitakin, tarkempia ja vahvempia menetelmiä on keksitty.[11][12] Esimerkiksi katkaistu keskiarvo otoksen järjestystilaston keskimmäisistä 24 prosentista tapauksia antaa x0:lle arvion tehokkaammin kuin koko otoksen mediaani.[13][14] Kun Cauchy-jakauma kuitenkin on ääripäistään "paksu" eli sen tiheysfunktio lähestyy kummassakin päässä vain hitaasti nollaa, arvion tehokkuus alenee, kun otoskoko ylittää 24 %.[13][14]

Parametrin x0 and γ arviointiin voidaan käyttää myös suurimman uskottavuuden estimointia. Se on yleensä kuitenkin hankalaa, koska sitä varten on ratkaistava korkeamman asteen polynomiyhtälö, ja sillä voi olla useita ratkaisuja, jotka vastaavat korkeamman asteen polynomiyhtälön juuret, ja sillä voi olla useita juuria, jotka vastaavat lokaaleja maksimikohtia.[15] Lisäksi vaikka suurimman uskottavuuden estimointi onkin asymptoottisesti tehokas, pienillä otoksilla se on melko tehoton.[16][17] Otoskoolla n Cauchy-jakauman logaritminen todennäköisyysfunktio on:

Maksimoimalla logaritminen todennäköisyysfunktio x0:n ja γ:n suhteen saadaan seuraava yhtälöryhmä:

On huomattava, että

on γ:n monotoninen funktio ja että ratkaisun γ täytyy toteuttaa epäyhtälö

Pelkän x0:n ratkaiseminen edellyttää 2n-1:nnen asteen polynomiyhtälön ratkaisemista,[15] ja pelkän γn ratkaiseminen n:nnen asteen polynomiyhtälön ratkaisemista (ensin γ2:n, sitten x0:n). Siksi yleensä onkin käytettävä tietokoneella suoritettavia numeerisen analyysin menetelmiä, olipa tarkoituksena ratkaista molemmat parametrit tai vain toinen niistä. Suurimman uskottavuuden estimoinnin etuna on asymptoottinen tehokkuus; x0:n estimointi otoksen mediaanin avulla on vain 81-prosenttisesti niin tehokas kuin sen estimointi suurimman uskottavuuden menetelmällä.[14][18] Katkaistun otoskeskiarvon menetelmä 24 prosentin järjestystilastolla on asymptoottisesti noin 88-prosenttisesti niin tehokas kuin x0:n estimointi suurimman uskottavuuden menetelmällä.[14] Menetelmiä voidaan myös yhdistää etsimällä keskimmäisten 24 prosentin järjestystilastolla x0 jokin alustava likiarvo, jota sitten parannetaan suurimman uskottavuuden estimaattoreilla soveltamalla Newtonin menetelmää.

Moniulotteinen Cauchy-jakauma

Satunnaisvektorin X = (X1, ..., Xk)' sanotaan noudattavan moniulotteista Cauchy-jakaumaa, jos sen komponenttien jokainen lineaarikombinaatio Y = a1X1 + ... + akXk noudattaa Cauchy-jakaumaa. Toisin sanoen jokaisen vakiovektorin ja satunnaisvektorin X pistetulo a · X noudattaa tavallista (yksiulotteista) Cauchy-jakaumaa.[19] Moniulotteisen Cauchy-jakauman karakteristinen funktio on

missä x0(t) ja γ(t) ovat reaalifunktioita, joilla x0(t) on ensimmäisen asteen homogeeninen funktio ja γ(t) positiivinen homogeeninen ensimmäisen asteen funktio.[19] Täsmällisemmin sanottuna:[19]

kaikilla t.

Esimerkki bivariaattisesta Cauchy-jakaumasta saadaan lausekkeella:[20]

Vaikka tämä esimerkki ei olekaan analoginen kovariantin matriisin kanssa, voidaan todeta, että x ja y eivät ole riippumattomia.[20]

Analogisesti tavallisen yksiulotteisen tiheysfunktion kanssa myös moniulotteinen Cauchyn tiheysfunktio liittyy läheisesti moniulotteiseen Studentin jakaumaan. Jos viimeksi mainitun vapausasteluku on 1, kyseessä on sama kuin moniulotteisen Cauchy-jakauma. Ja k-ulotteisen Studentin jakauman tiheysfunktio yhdellä vapausasteella on:

Muunnosominaisuudet

  • Jos , niin
  • Jos ja ovat riippumattomia, niin
  • Jos , niin
  • McCullaghin parametraatio Cauchy-jakaumalle: Jos Cauchy-jakauman ilmaiseminen kompleksiparametrin , voidaan märitellä, että X ~ Cauchy(ψ), jos X ~ Cauchy. Jos X ~ Cauchy(ψ) niin:
~ Cauchy

missä a,b,c ja d ovat reaalilukuja.

  • Jos X ~ Cauchy(ψ) edellä esitetyn määritelmän mukaisessa mielessä, niin
~ CCauchy
missä "CCauchy" on sirkulaarinen Cauchy-jakauma.

Suhde muihin jakaumiin

  • on sama kuin Studentin t-jakauma
  • on sama kuin , ei-standardoitu Studentin t-jakauma
  • Jos ja X ja Y ovat riippumattomia, niin
  • Jos niin
  • Jos X ~ Log-Cauchy(0, 1) niin ln(X) ~ Cauchy(0, 1)
  • Cauchy-jakauma on rajatapaus tyypin 4 Pearsonin jakaumastalähde?
  • Cauchy-jakauma on erikoistapaus tyypin 7 Pearsonin jakaumasta[21]
  • Cauchy-jakauma on hyperbolisen jakauman singulaarinen raja-arvo
Käännös suomeksi
Käännös suomeksi
Tämä artikkeli tai sen osa on käännetty tai siihen on haettu tietoja muunkielisen Wikipedian artikkelista.
Alkuperäinen artikkeli: en:Cauchy distribution

Lähteet

Aiheesta muualla

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.