valószínűségi tétel From Wikipedia, the free encyclopedia
A centrális határeloszlás-tétel (CHT) azt mondja ki, hogy adott feltételek mellett, elegendően nagy számú és független valószínűségi változó középértéke (várható értéke) jó közelítéssel normális eloszlású, ha a független valószínűségi változók jól meghatározott középértékkel és szórásnégyzettel rendelkeznek.[1] Ha nem tesszük fel ezt a két utóbbi feltételt, akkor csak azt tudjuk, hogy a határeloszlás stabil.[2]
A centrális határeloszlás-tételnek számos változata van. Az általános formájában a valószínűségi változók hasonló eloszlásúaknak kell lenniük. Vannak olyan változatok, ahol a normális eloszlás középértékéhez történő konvergencia a nem azonos eloszlást mutató valószínűségi változóknál is előfordul, bizonyos feltételek mellett, például Ljapunov-feltétel vagy Lindenberg-feltétel. Ezek kizárják, hogy az egyes tagok túl nagy hatással legyenek az összegre.
A valószínűségi elméletben a centrális határeloszlás-tétel az úgynevezett gyenge konvergenciájú halmaz része. Ez arról a tényről szól, hogy sok független és azonos eloszlású valószínűségi változó összege egy attraktor eloszlás kis halmazához közelít. Ha a független és azonos eloszlású valószínűségi változók szórásnégyzete véges, akkor az attraktor eloszlás a normális eloszlás. Ezzel ellentétben, ha a valószínűségi változó négyzetes törvény szerinti elnyúló farok résszel rendelkezik, a szórásnégyzet végtelen, akkor az alfa-stabil eloszlás felé tart, alfa stabilitás paraméterrel, ahogy a változók száma nő.[3]
Az elnevezés Pólya György egy 1920-as dolgozatára megy vissza, aminek címe németül Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem.[4]
Legyenek X1, ..., Xn egy n elemszámú minta tagjai, egy független és azonos eloszlású valószínűségi változók sorozata, µ várható értékkel és σ2 szórásnégyzettel. Tegyük fel, hogy a minták átlaga:
A nagy számok törvénye szerint a mintaátlagok majdnem biztosan a µ várható értékhez konvergálnak, ahogy n → ∞. A klasszikus CHT leírja a középérték, µ körüli sztochasztikus fluktuáció méretét és eloszlási formáját a konvergencia során. Pontosabban azt állítja, hogy ahogy n nő, a minta átlaga Sn és annak várható értéke (µ) közötti különbség eloszlása, ha megszorozzuk a n tényezővel (azaz n(Sn − µ)), akkor közelít a normális eloszláshoz, 0 középértékkel és σ2 szórásnégyzettel. Ha n elég nagy, akkor Sn eloszlása közel normális eloszlású µ középértékkel és σ2/n szórásnégyzettel. Az elmélet hasznossága az, hogy (Sn − µ) közelít a normálishoz, tekintet nélkül az egyedi Xi-k eloszlásának formáitól.
Formálisabban, az -edik összeg . Az várható értéke , szórásnégyzete . Az összeget standardizálva
ami pontonként tart az standard normális eloszláshoz, ha . Ez azt jelenti, hogy -vel jelölve a standard normális eloszlás eloszlásfüggvényét, minden valós számra
Egy másik írásmóddal
ahol
tag átlaga.
A mellékelt ábrán látható, hogy a hatoldalú kocka dobásának eloszlása az n növelése függvényében, az eloszlás tart a normális eloszláshoz.
Statisztikai alkalmazásokban a konvergencia a mintanagyság növelésével gyorsítható.
Az USA-ban 1973 és 1978 között vizsgált baleseti halálok eloszlása is tart a normális eloszlás felé a CHT miatt.
Számos esetet publikáltak, ahol a CHT törvénye működik.[5]
Az úgynevezett véletlenszerű bolyongáskor követett útvonalak eloszlásai is tendálnak a normális eloszlás felé[6] Nagy számú pénzérme feldobásakor a „fej” eredmények normális eloszlást mutatnak az összes fejre viszonyítva (vagy írásra). Elektronikus zajok természete is normális eloszlást mutat elegendően nagy számú kísérletnél. Általánosságban is elmondható, hogy minél több mérést végzünk független változókkal egyenlő befolyással (körülmények között), akkor az eloszlás tart a normális eloszlás felé. Számos statisztikai eredmény és számítógépes megoldás mutatja a konvergenciát a centrális határeloszlás szerint.[7]
Az első verzió Abraham de Moivre francia matematikus nevéhez kötődik (1733).[8] A publikációt teljesen elfelejtették, majd 1812-ben a híres francia matematikus Pierre-Simon Laplace vette elő a homályból az elméletet. Az elmélet fontosságát egy orosz matematikus, Alekszandr Mihajlovics Ljapunov ismerte fel 1901-ben, és bizonyította a tétel működését, a valószínűségi elmélet területén. A ’centrális határ-eloszlás’ elnevezést Pólya György használta először egy publikációjában 1920-ban.[9][10] Az elmélet kifejtéséhez számos matematikus, statisztikus járult hozzá (Anders Hald, Augustin Cauchy, Friedrich Bessel, Siméon Denis Poisson, Paul Pierre Lévy, Harald Cramér). Az első bizonyítások Bernstein, Pafnutyij Lvovics Csebisov, Id. Andrej Andrejevics Markov és Alekszandr Mihajlovics Ljapunov neveihez fűződik, 1935 körül.[10][11] Érdekesség a történetben, hogy Alan Turing disszertációjában (King's College, University of Cambridge) a CHT bizonyítása szerepelt. Ezt a disszertációt sohasem publikálták.[12][13][14]
A bizonyítást többnyire a karakterisztikus függvények tulajdonságairól szóló általánosabb tételekre alapozzák. Elegendő tudni a sorozat elemeinek momentumait illetve kumulánsait, amelyekkel meghatározható a karakterisztikus függvény Taylor-sora.
Elemi úton is belátható. Ehhez megvizsgálják az alakú várható értékeket, amelyek egyrészt megfelelnek egy egy zárt intervallum indikátorfüggvénye esetén a valószínűségnek, másrészt jól approximálhatók egy elegendően sima függvénnyel. Ez az eljárás Jarl Waldemar Lindebergtől származik.[15]
A Berry–Esseen-tétel erősíti a tétel eredményét: Ha létezik a harmadik centrális momentum, és véges, akkor az eloszlás egyenletesen konvergál a normális eloszláshoz, és a konvergencia sebessége legalább .
Független Bernoulli-eloszlású valószínűségi változók esetén az összeg binomiális eloszlású. Ekkor a Moivre-Laplace-tétel a centrális határeloszlás tételéből adódik.
Ugyanolyan stabil eloszlások esetén már végesben teljesül a tétel, hiszen a stabilitás miatt az összeg és a lenormált összeg is szintén a stabil eloszlás családjából való. Normális eloszlás esetén ez is teljesül. Vannak más stabil eloszlások is, de ez az egyetlen, aminek véges a szórása.
Magasabb dimenzióban a tétel hasonlóan teljesül. A határeloszlás ott is stabil, emiatt véges szórású esetekben a határeloszlás több dimenziós normális eloszlás lesz.
Vannak olyan változatok, amelyekben megengedett az összefüggés bizonyos valószínűségi változók között. A Lindenberg- és a Ljapunov-feltételek olyan csoportokat képeznek, amelyeken belül a valószínűségi változók függetlenek, és csak különböző csoportokba tartozó változók között lehet összefüggés. A csoportképzés módját sémának nevezik, tehát a fenti feltételek sémákat alkotnak.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.