From Wikipedia, the free encyclopedia
Idősornak az olyan statisztikai megfigyeléseket nevezzük, amelynek elemeit egymást követő időpontokban (időszakokban) regisztrálták, és ez az időbeliség az adatok fontos tulajdonsága.
Példa lehet:
Az idősoros megfigyeléseket tekinthetjük a teljes statisztikai populációnak is de gyakrabban feltételezzük, hogy az megfigyelések az valószínűségi változók (sztochasztikus folyamat) realizációi. Eszerint egy statisztikai minta, melyből a populációban meglévő összefüggésekre kívánunk következtetni.
Szűkebb értelemben megköveteljük, hogy a mintavételezés szabályos időközönként történjen, de ha ez a feltétel nem teljesül, az idősor elemzésének néhány fázisa ekkor is elvégezhető (értelmezhető).
Szabályos idősorok modellezésére az egyszerűbb sorozat-függvényt használjuk, azaz a mintavételezés egzakt időpontjai (dátum, hh:mm:ss) helyett csak a minták sorszámával azonosítjuk az adatokat és sorrendjüket. Szabálytalan adatsorban lehetnek egyenetlenek az intervallumok vagy általában azonosak, de néhány időpontban hiányzik az adat.
Az idősorok elemzésére a legtöbb általános statisztikát (statisztikai függvényt) alkalmazhatjuk: az átlag (számtani-, kronologikus- stb.), a szórás, a terjedelem stb. kiszámítható, értelmezhető. Azonban az adatok feltételezett időbeli struktúrája komolyabb elemzést is lehetővé tesz. Például az elemi vizsgálatokon túl lehetőség-szükség lehet olyan számításokra, amelyek a vizsgált mennyiség jövőbeli alakulására adnak becslést (prognózis). Erre mutatunk egy példát:
Egy szezonális árucikk (pl. fagylalt, napolaj) forgalmazásának havonkénti adatait tartalmazza az Excel-munkatábla (C/Idősor/Y) oszlopa. Az első oszlopban látható, hogy a mintavételezést 5 éven (60 hónap) keresztül végezték. Az illusztrációban közömbös, hogy az elemek a havi bevételt (MFt-ban), vagy az eladott termék tömegét (tonnában, literben, dobozokban) adják meg.
az adatok grafikus ábrázolásával „megsejthető” a folyamat irányzata (trend), ami a példában lineárisan emelkedőnek tűnik. (Más példában tapasztalhatunk exponenciális, logaritmikus stb. változásra utaló tendenciát.) A trend értékeit (itt) a T = m.t + b formulának megfelelően kiszámíthatjuk. Ezt tartalmazza a táblázat (D/Trend/T) fejlécű oszlopa.
Az idősort és a trendvonalat ábrázoló grafikonból látszik, hogy a mért (Y) és a számított (T) értékek különbsége szabálytalan sorozatot alkot: fluktuáció (ingadozás). Ennek a sztochasztikus (véletlenszerű) adatsornak az értékeit kiszámíthatjuk: a táblázat (E/Fluktuáció/Y-T) oszlopa.
Az F = T-Y adatsor grafikonjából (és természetesen az árucikk szezonális jellegéből) következtethetünk arra, hogy a fluktuációt két hatás okozza, s ezek közül az egyik valamilyen periodikus (ún. szezonális = S) komponens (itt az éghajlat), melyre rárakódik egy véletlenszerű (random =R) perturbáció. Ezért az eredeti adatsort (Y) három komponensekre bonthatjuk – trend (T), szezonális (S) és véletlen (R). A feltételezett matematikai modell tehát így írható:
Y(t) = T(t) + S(t) + R(t)
a periódus meghatározása (becslése) alapján kiszámítjuk az egyes szezonok azonos időszakában számított fluktuációknak az átlagát és a szórását. Az Excel-tábla E-F-G-H-I oszlopaiban láthatók az egyes évek azonos hónapjaihoz tartozó számított értékek (halvány zöld alapszínnel kiemelt cellák), ezek soronkénti átlaga és szórása a munkalap J ill. K oszlopába kerültek. A statisztikai adatfeldolgozási gyakorlatban használt ú.n. három-szigma szabályt alkalmazva meghatározhatjuk annak a (konfidencia)intervallumnak a felső (max) és alsó (min) határát, amelybe a fluktuáció esik.
A prognózist ezek után úgy adhatjuk meg, hogy
Az ábrán e két számsor által meghatározott (interpolált) görbe adja a becslés konfidenciasávját 99%-os megbízhatósági szinten.
A ciklikus (periodikus) mozgás sémáját az alábbiakban mutatjuk be, ami, a fizikából ismert harmonikus rezgés modelljére épül, melyben az 1. szakasz a pangás, (depresszió), 2. szakasz a megélénkülés, (expanzió), 3. szakasz a fellendülés, (prosperitás), 4. szakasz pedig a válság (recesszió vagy hanyatlás) időszaka.
Ha csak egy fellendülő és egy visszaeső fázist különböztetnek meg, gyakran a következő terminológiát használják: felszálló ág és leszálló ág, alacsonyabb fordulópont vagy hullámvölgy (mélypont), fellendülés vagy növekedés, magasabb fordulópont (csúcs), és visszaesés vagy csökkenés. A gyakorlati tapasztalatok szerint a ciklusok periódusa és amplitúdója változik. A nemzetközi szakirodalom a következő öt konjunktúra-ciklust feltételezi és különbözteti meg: 1. a 3–5 éves leltár (készlet) vagy Kitchin-ciklus; 2. a 7–11 éves állandó befektetési (gépi beruházási) vagy Juglar-ciklus; 3. a 15–25 éves építési vagy Kuznets-ciklus; 4. a 45–60 éves hosszú vagy Kondratyev-ciklus; 5. a 100 évnél hosszabb évszázados vagy szekuláris trendek
A ciklusok periódusa tehát duplázódhat, pl. egy Kondratyev ciklus [57 év] tartalmazhat 6 Juglart [9,5 év] és egy Juglar tartalmaz 3 Kitchint [3,16 év]. Ha például a Kondratyev ciklus hosszát [periódusát] átlagosan 54 évnek vesszük, és a Kuznets ciklust 18 évesnek állítjuk, a Juglar ciklust 9 évesnek, a Kitchin ciklust 4,5 évesnek vesszük, akkor a kapcsolat teljesen tiszta: 1 Kondratyev ciklus = 3 Kuznets ciklus = 6 Juglar =12 Kitchin. Egyszerű technikai eljárásokkal a ciklusokat részmozgásokra oszthatjuk, egyiket-másikat kiszűrhetjük a vizsgálni kívánt mozgás kimutatása érdekében. A trend a ciklus kiküszöbölésével felfedhető (például mozgóátlagolással, grafikus becsléssel, vagy a szokásos legkisebb négyzetek módszerének alkalmazásával). Kondratyev vizsgálati módszerének az a lényege, hogy az árakat egyszerű statisztikai indexszel ábrázolja, egyes pénzügyi (kamatráta, bérek), vegyes jellegű (külkereskedelmi forgalom), illetve tisztán naturális sorok esetében a trendtől való eltérés számítási módszerét alkalmazza. Az utóbbiaknál (külkereskedelem és termelés, valamint fogyasztás) mindig egy főre jutó adatokat használ, és a legkisebb négyzetek módszerével számított trendtől való eltéréseket vizsgálja úgy, hogy 9 éves mozgóátlagolással megpróbálja kiszűrni a rövidebb ciklusú mozgásokat. Ennek a megközelítésnek az a lényege, hogy ne az egyedi, hanem a hosszútávon érvényesülő összetett hatásokat ragadjuk meg, és ezáltal tudjunk a múltban érvényesült, és részben a jövőre is várható tendenciák segítségével hozzátenni valamit a rövid távú szakmai elemzésekhez. a ciklusok időtartama (periódusa) duplázódik. Ugyanakkor a különböző időtartamú ciklusok egyidejűek, keverednek, mozgásukkal csökkentik, vagy növelik az egész hullámzás amplitúdóját. Ha például az év-százados trend felszálló ága találkozik a Kondratyev ciklus leszálló ágával, akkor ez a válságot mérsékli, ellenkező esetben erősíti. Itt is érvényesül a fizikából ismert interferencia jelensége, illetve törvénye. Egy-szerű technikai eljárásokkal a ciklusokat részmozgásokra oszthatjuk, egyiket-másikat kiszűrhetjük a vizsgálni kívánt mozgás kimutatása érdekében. A hosszú ciklus kimutatása: Az idősor elemei a hosszú ciklus vizsgálatánál a következők lehetnek: 1. Évszázados trend 2. 3-9-27 éves Kitchin-, Juglar-, és a Kuznets- ciklusok 3. Kondratyev ciklus 4. Véletlen hatás Az idősor hossza legalább 100 év, ebben az esetben egy évszázados trend és két hosszú-ciklus mutatható ki. A hosszú ciklusok vizsgálatánál először az eredeti idősor 9 vagy 27 tagú mozgóátlagát vesszük. A 9 tagú mozgóátlagolással a 3 éves periódusú Kitchin- és a 9 éves periódusú Juglar-, illetve 27 tagú mozgóátlagolásnál a Kuznets-ciklust is kiküszöböljük. A rövidebb ciklusok természetesen – az előzőekben ismer-tettek szerint – különböző periódusúak lehetnek, pl. 4-8-16 évesek, ebben az esetben 16 tag mozgóátlagolással küszöbölhető ki a Kitchin, a Juglar és a Kuznets-ciklus. A mozgóátlagolással a véletlen hatást is kiszűrjük. A mozgóátlagolás csak akkor küszöböli ki a periodikus hullámzást, ha a mozgóátlag tagszáma a periódus hosszával vagy egészszámú többszörösével egyenlő. Ha nagyobb tagszámot választunk, akkor a hullámzás ellentétes lesz a ciklussal, ha kisebb tagszámot választunk, mint a ciklus periódusa, akkor csak tompítjuk a hullámzást. A grafikus ábrát ezért alaposan kell elemezni, hogy a megfelelő mozgóátlag tag-számot kiválasszuk. Ezt követi a trend kiküszöbölése. Additív kapcsolat esetén a trendet az eredeti idősorból kivonjuk, multiplikatív kapcsolat esetén az eredeti idősort a trenddel osztjuk. Eljárhatunk úgy is, hogy először a trendet küszöböljük ki, s ezt követi a mozgóátlagolás. A két eljárás [sorrend], azonos eredményre vezet. A rövid (Kitchin) ciklus kimutatása: Az idősor elemei a rövid ciklus vizsgálatánál a következők lehetnek: 1. Trend, ami lehet valamely hosszú ciklus fel, vagy leszálló ága 2. 3-5 éves Kitchin ciklus 3. Szezonális hullámzás 4. Véletlen hatás Ha csak rövidebb ciklusokat vizsgálunk, akkor a szezonhatást küszöböljük ki mozgóátlagolással, s ezután a trendhatást. Havi adatoknál 12 tagú, negyedéves adatoknál 4 tagú mozgóátlagolást alkalmazunk. A rövid ciklusok átlagos periódushosszának becslésére a ciklusfordulópontokszámítása.xlsm Excel parancs-fájl használható. A program megkeresi az alsó és felső fordulópontokat, a felső fordulópontot (amikor a növekedés után csökkenés következik) + jellel, az alsó fordulópontot (amikor csökkenés után növekedés következik) – jellel jelöli. A hullámhossz egy teljes hullámnak a hossza, ami becsülhető a csúcsponttól a csúcspontig (+tól a következő +ig), vagy a mélyponttól a mélypontig (-tól a következő -ig). A program megkeresi a legelső + illetve – értéket és az eredmények munkalapon ezeket a fordulópontokat bejelöli. A következő táblázat sorszámokkal látja el a fordulópontokat, pl. az első + érték kapja az egy értéket, a ciklushosszát innentől számítjuk, a következő megfigyelések addig kapnak 1 értéket, amíg a program meg nem találja a következő + jellel jelölt fordulópontot, innen a jelölés 2. Ennek alapján megállapítható hány fordulópont van az idősorban. A rövidebb ciklusok kiküszöbölésére ezt az értéket vagy egész számú többszörösét használjuk mozgó átlag tagszámként. A trendszezon-hibaszámítás.xlsm Excel parancsfájl felhasználásával, most már megadhatjuk a mozgó átlag tagszámát. A program működése: Módosíthatók a trendek paraméterei és a szezon erőssége (ahol a nagyobb szám nagyobb amplitúdójú szezonkomponenst generál). A következő trendek modellezhetők: lineáris, féllogaritmikus, másodfokú parabolikus, harmadfokú parabolikus, exponenciális, elsőfokú hiperbolikus és S alakú logisztikus. A program elkészíti a trendek és a szezonkomponensek ábráját az additív és a multiplikatív modell esetben, továbbá csak a trendet, ha feltételezzük, hogy nincs szezonális hatás. A program célja az, hogy felismerjük azt, hogy egy idősor grafikus ábrája alapján milyen trendtípusok és szezonális (periodikus) kapcsolatok (additív vagy multiplikatív) jöhetnek számításba. A trend paramétereinek és a szezon erőssége változtatásával nyomon követhetők a grafikus ábrák változásai. A kézikönyv tartalmazza a különböző ciklusok kiküszöbölésének a módszerét is.
Az exponenciális kiegyenlítés a számtani, illetve a mozgó átlagolás továbbfejlesztett változata. Ki-küszöböli a mozgó átlagolás azon hibáját, hogy az minden adatot azonos súllyal vesz figyelembe. A legújabb adatok általában nagyobb szerepet játszanak a jövőbeli adatok alakulásában, mint a régebbi adatok. Ezért a legfrissebb adatoknak a megelőzőnél relatíve nagyobb súlyt kell adnunk. Előnye, hogy egyszerűen kezelhető, nem kíván nagyobb matematikai elmélyülést. Az alkalmazhatóság feltételeit is meg kell említeni: megfelelő hosszúságú idősor [20-90] szükséges a kiegyenlítéshez. Az adatállomány maximum 2500 megfigyelés lehet. 12 exponenciális simítási módszert programoztunk. A szezonalitást tartalmazó modellek esetében az ex-post és az ex-ante előrejelzés időszaka rögzített, a szezonalitás hosszával (L) egyenlő, tehát havi adatoknál 12, negyedéves adatoknál 4, heti adatoknál 7 stb. A sze-zonalitás hossza (L) tetszőlegesen változtatható. A program az MSE minimalizálásával (solver) keresi meg a legjobb illeszkedést adó paramétereket. Egy kivétel van a normál exponenciális simítás (SES) ahol a MAPE alapján optimalizál. A szezonalitást nem tartalmazó 4 simítási eljárás esetében a becslési és teszt időszak tetszőlegesen változtatható. Az exponenciális simítás alkalmazott típusai:
A következő telítődési függvény becslését végzi el a program:
A logisztikustrendekbecslése.xls Excel parancsfájl a bemutatott tizenkét logisztikus trendfüggvény illesztését könnyíti meg a felhasználók számára. Tizenkét olyan munkalapot tartalmaz, melyek a különböző függvényformák nevei alapján kerültek elnevezésre, valamint egy Ciklus nevű munkalapot, mely a különböző illesztett trendek alapján a rövid és hosszú távú ciklusok vizsgálatát teszi lehetővé. A fájlban a cellák színezése jelentőséggel bír: a halványsárga cellák szabadon változtathatók, a zöld cellák az egyes paraméterek javasolt kezdeti értékeit adják meg, míg a fehér cellák számítási (rész)eredményeket tartalmaznak. A színezés alapján látható, hogy a fájl maximálisan 1000 hosszúságú idősor feldolgozására képes. Az egyes munkalapok között nincs összefüggés, azaz amennyiben több trendet kíván a felhasználó illeszteni ugyan-arra az adatsorra, úgy az adatokat valamennyi kiválasztott lapra be kell másolnia. Új adatbevitel esetén mind a 12 munkalapon törölni kell az adatokat, az adatok törlése ikonra kattintva, utána pedig bemásolni az új adatállományt. A fájl az adatok beillesztését követően azonnal ábrázolja az idősort, valamint az aktuálisan bevitt paraméterek alapján a trendfüggvényt is. Az Idő oszlop kitöltése opcionális, amennyiben kitöltésre kerül, úgy az ábrázolás esetén ezt figyelembe veszi a fájl az időtengely felirataként. A javasolt kezdeti paraméterek az egyes függvények nevezetes pontjai (maximálisan felvett érték, első időszak megfigyelésének értéke, inflexiós pont stb.) alapján kerültek meghatározásra. A Pearl–Reed-féle logisztikus függvény példáján keresztül mindez azt jelenti, hogy a K paraméter javasolt értéke az idősor-ban található maximális értékkel egyezik meg. alapján következtethetünk c közelítő értékére. A többi trend esetén az ajánlott kezdőértékek teljesen hasonló módon kerültek meghatározásra. Az induló paraméterek ilyen módon történő meghatározása azt okozhatja, hogy amennyiben olyan jelenséget vizsgálunk, amely már „lefutott”, és az illeszteni kívánt függvény alkalmas, úgy a kezdő paraméterek megadásával jól illeszkedő függvényt kapunk. Amennyiben egy telítődési, vagy életciklus-folyamat elején tartó jelenséget vizsgálunk, úgy a feltüntetett paraméterek helyett szakértői, elemzői tapasztalatra kell támaszkodni. Az induló paraméterek természetesen nem minden esetben adnak tökéletes javaslatot, így lehetőség van a paraméterek kézi vezérlésére is. Valamennyi munkalap tartalmaz olyan parancsgombokat, melyek a paraméterek finomhangolását végzik el (Opt. mind). A parancsgombok az Excel beépített Solver funkcióját hívják meg. Lehetőség van arra is, hogy a Solver a (kézzel, szakértői becslés alapján beállított) telítődési paraméter értékén ne változtasson, ekkor csupán a többi paraméter nagyságát fogja a program meghatározni (Opt. K nélkül). Az Excel beépített Solver csomagja nem képes minden esetben globális optimumot találni, így érdemes az illesztést több különböző, kézzel beállított indulóértékkel elvégezni. Főként az életgörbe és Hubbert függvények esetén problémát okozhat a paraméterek nagyságrendjének jelentős eltérése. A Solver ebben az esetben a túlságosan nagy paramétert nem mozdítja el kezdeti értékéről. A megoldás az eredeti adatsor dimenziójának változtatása (pl. 1000-rel való osztás).A kielégítőnek ítélt paraméterek megtalálása után az extrapoláció beállításával lehetőség van a trend mechanikus kiterjesztésére (a megfigyelések száma az extrapolációval együtt sem lépheti át az 1000 darabot). A Ciklus munkalapon az illesztett trendek további vizsgálatára (reziduumok ábrázolása, mozgóátlagolása), és összehasonlítására nyílik lehetőség. A Ciklus munkalap valamennyi esetben az adott függ-vény munkalapján beállított paraméterezés alapján dolgozik. A ciklus munkalapon kiválaszthatjuk a 12 trend közül azt, amit vizsgálni kívánunk (természetesen egyenként mind a 12 trendfüggvény konjunktúra ciklusait vizsgálhatjuk és összehasonlíthatjuk) és meg kell adni a mozgóátlag tagszámát. A mozgóátlag tagszáma az adatbázistól függ. Rövid ciklusok vizsgálata esetében a szezonalitást küszöböljük ki, ha havi adatok állnak rendelkezésre a mozgóátlag tagszáma 12, negyedéves adatok esetében 4. Ha a hosszú ciklusokat vizsgáljuk éves adatokkal, akkor általában 8 vagy 9 tagú mozgóátlagot választunk a rövidebb periódusú (pl. 4-8 vagy 3-9 éves) ciklusok kiszűrésére. (Megjegyezzük, hogy a rövidebb ciklusok kiszűrése után, ha ezt követően kiszűrjük a trendhatást, akkor a Kondratyev – féle hosszú ciklus becslését kapjuk meg.) Vizsgálni lehet az idősorokat abból a szempontból is, hogy hogyan reagálnak a mozgóátlag tagszámának megváltoztatására. Választhatunk az additív és a multiplikatív modell között. Az adatok bevitele után a program ábrázolja az eredeti adatokat és a trendet és a második ábrában a ciklust. Ki-számítja multiplikatív kapcsolatot feltételezve az eredeti idősor és a trend hányadosát, valamint additív kapcsolatot feltételezve az eredeti idősor és a trend különbségét. Így mindkét feltételezés mellett kiküszöböli a trendhatást. A ciklikus mozgásokat a trendtől megtisztított idősoroknál a fel-használó által megadott mozgóátlag tagszám alapján mozgóátlagolással küszöböli ki és számítja, valamint ábrázolja. Ciklus munkalapon: Válassza ki a trend típusát, a mozgóátlag tagszámát (ha 1 akkor nincs mozgóátlagolás) a trend és a periodikus hullámzás kapcsolódás módját: additív vagy multiplikatív. A sárga kockákban levő számok cserélhetők. Ha a mozgóátlag tagszáma 1, akkor az eredeti adatok és a trend különbségével illetve hányadosával számol a program. Ha az Idő oszlopba bemásoljuk a tényleges időt, pl. éveket, akkor az ábra X tengelye ezt veszi figyelembe, ha az Idő oszlop üresen marad, akkor a sorszámok jelennek meg az X tengelyen.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.