From Wikipedia, the free encyclopedia
Статистика је област математике која се бави сакупљањем, анализом, интерпретацијом, објашњавањем и презентацијом података.[1][2] Она се примењује у широком спектру академских дисциплина, од физике до економије и социологије.
Неке од популарних дефиниција су:
Математички методи статистике су потекли из теорије вероватноће, из времена дописивања Пјера Ферма и Блеза Паскала (1654). Кристијан Хајгенс (1657) је дао прво познато научно третирање ове теме. Јакоб Бернули у делу (постхумно, 1713) и Абрам д Моавр у делу Доктрина шанси (1718) су статистику посматрали као грану математике[5] У модерно доба, рад Колмогорова је био битан за формулисање основног модела теорије вероватноће који се користи у основи статистике.
Основна подела статистике је на дескриптивну и инференцијалну..[6] Дескриптивна статистика бави се мерама централне тенденције (аритметичка средина, медијана и мод), мерама варијабилитета (распон, стандардна девијација, варијанца, интерквартилни распон, семиинтерквартилни распон и просечно одступање), као и графичким и табеларним приказивањем основних статистичких вредности. С друге стране, инференцијална статистика се односи на проверавање постављених хипотеза (нултих и афирмативних/алтернативних), уз помоћ статистичких тестова, коефицијената и њихове значајности (т-тест, анализа варијанце, хи-квадрат тест, коефицијенти асоцијације и корелације, дискриминациона анализа, Ман-Витнијев тест, Тест знака ...). У статистичком жаргону, дескриптивна статистика се назива статистиком са малим с, а инференцијална статистиком са великим С, јер је основни циљ дескриптивне статистике да понуди податке који се даље могу обрађивати уз помоћ техника инференцијалне статистике.[7]
Друга подела се односи на технике које се користе у статистици. Сагласно томе, разликује се параметријска и непараметријска статистика.[8] У случају параметријске статистике, прорачуни се темеље на нормалној (Гаусовој) дистрибуцији, док се у случају непараметријске статистике спроводе тестови који не морају подразумевати нормалност дистрибуције података којима располажемо. Примери прве групе техника су: сложена анализа варијансе, Пирсонов продукат - коефицијент корелације, аритметичка средина, стандардна девијација ... Примери за другу групу техника су: Спирманов коефицијент корелације, хи-квадратни тест, Крускал-Валисов тест, медијана, модуо и сл.
Статистика је неодвојива од теорије вероватноће, која представља скуп математичких модела за описивање односа између остварених догађаја (исхода) и могућих догађаја. Најважнији концепт теорије вјероватноће који има широку примену у статистици је нормална расподела. Стандардна нормална расподела има аритметичку средину М = 0 и стандардну девијацију која износи СД = 1. Удаљеност неког резултата (податка) од аритметичке средине, у јединицама стандардне девијације, представља тзв. -вредност. Уколико је -вредност виша од нуле, резултат се налази изнад аритметичке средине. У супротном, дати резултат пада испод просека.
Како би се применила нека од статистичких техника/процедура, потребно је прво поставити адекватну хипотезу. Хипотезе могу бити нулте (где се не претпоставља разлика између две или више група испитаника или се не претпоставља да ће корелација између неколико варијабли бити статистички значајна). Такође, постоје и афирмативне хипотезе, којима се претпоставља нека статистички значајна разлика или повезаност.[9]
Примери за нулте хипотезе су:
Примери за афирмативне хипотезе су:
Статистика је математичко тело науке које се бави сакупљањем, анализом, интерпретацијом или објашњавањем, и представљањем података.[10] Она се може сматрати граном математике.[11] Неки сматрају да је статистика засебна математичка наука, пре него грана математике. За разлику од многих научних дисциплина које користе податке, статистика се бави употребом података у контексту неизвесности и одлучивањем у светлу вероватноће.[12][13]
Математичка статистика је примена математике на статистику. Математичке технике које се за то користе обухватају математичку анализу, линеарну алгебру, стохастичку анализу, диференцијалне једначине, и теорију вероватноће.[14][15]
При примени статистике на проблем, уобичајена је пракса да се почне са популацијом или процесом који се студира. Популације могу да буду разноврсне теме као што су „све особе која живе у земљи“ или „сваки атом од кога се састоји кристал“.
Идеално, статистичари прикупе податке о целокупној популацији (операција звана попис). То може да буде организовано посредством државних статистичких завода. Описна статистика се може користити за сумирање података о становништву. Нумерички дескриптори обухватају средњу вредност и стандардну девијацију за континуиране податке (попут зараде), док су фреквенција и проценти кориснији при описивању категоричких података (попут расе).
Кад је попис могућ, изучава се изабрани подскуп популације који се назива узорак. Након одређивања репрезентативног узорка, подаци се прикупљају за чланове узорка у опсервационом или експерименталном окружењу. Описна статистика се може користити за сумирање података датих узорака. Пошто селекција узорака садржи елемент случајности, утврђени нумерички дескриптори узорка су исто тако подложни случајности. Да би се произвели смислени закључци о целокупној популацији, неопходна је примена статистичког закључивања. Користе се патерни у подацима узорка да би се извели закључци о представљеној популацији, узимајући у обзир случајност. Ти закључци могу да поприме облик: одговарања на „да/не питања“ о подацима (тестирање хипотезе), процењивање нумеричких карактеристика података (естимација), описивање асоцијација у подацима (корелација) и моделовање релација у подацима (на пример, користећи регресиону анализу). Извођење закључака може да обухвата прогнозирање, предвиђање и процењивање неуочених вредности било унутар или повезаних са студираном популацијом; то може да укључује екстраполацију и интерполацију временских серија или просторних података, а може да обухвата и анализу података.
Неки примери кориштења статистике:[16][17]
Психолошка статистика је математичко-методолошко испитивање и проучавање индивидуалних разлика у: личности, мотивацији, интелигенцији, ставовима, вредностима, интересовањима, емоцијама. Такође, проверавају се корелације између различитих варијабли, те допринос скупа (сета) варијабли (познатих под називом предиктори) једној критеријској варијабли (која је исход, последица, односно нека мера понашања или мишљења која је битна нпр. у послу, на факултету). Примери предиктора су: генерална интелигенција, мотивација и радне навике, а пример критерија је школски или академски успех на крају године.
Биомедицинска статистика је област која обухвата примену статистике у клиничким медицинским наукама, као и у биологији. Најчешћа примена у оквиру ове области је у експерименталним истраживањима, где се треба утврдити деловање неког лека или терапије, на начин да се упореде експериментална и контролна група. Ако је разлика између њих статистички значајна, онда та разлика заиста и постоји, а није резултат случаја.
Најчешћа логичка грешка је нерепрезентативан узорак при испитивању. Само испитивање може бити социолошки изведено савршено (испитаници попуњавају упутник неометани и анонимно), математичка анализа је изведена без грешака (зброј свих избора даје 100%, не мање или више, што се такође може догодити), међутим резултати ипак немају превише везе с реалношћу.
Узорак може бити нерепрезентативан из више разлога:
Још неке важне грешке приликом кориштења статистике су[23]:
Резултати добијени ваљаном анализом нерепрезентативног узорка су неваљани, као и они добијени неваљаном анализом репрезентативног узорка.
Статистички методи датирају још из 5. века п. н. е.[24]
Неки научници сматрају да статистика води порекло из 1663. године, из публикације Природне и политичке опсервације о записима о морталитету аутора Џона Гранта.[25] Ране примене статистичких размишљања су биле концентрисане око потребе држава да базирају законе на демографским и привредним подацима. Опсег статистичке дисциплине је проширен у раном 19. веку тако да је обухватао опште сакупљање и анализу података. У данашње време, статистика је у широкој примени у друштвеним, економским, и природним наукама.
Њене математичке основе су положене у 17. веку са развојем теорије вероватноће, чему су знатно допринели Ђироламо Кардано, Блез Паскал и Пјер де Ферма. Математичка теорија вероватноће је поникла из изучавања игара на срећу, мада је концепт вероватноће био већ испитиван у средњовековним законима и од стране филозофа попут Хуана Карамуела.[26] Метод најмањих квадрата је приви описао Адријен-Мари Лежандр 1805. године.
Модерна област статистике се појавила у касном 19. и раном 20. веку у три ступња.[27] Први талас, на прелазу века, је био вођен радом Френсиса Галтона и Карла Пирсона, који су трансформисали статистику у ригорозну математичку дисциплину која се користи за анализу, не само у науци, већи и у индустрији и политици. Галтонови доприноси обухватају увођење концепата стандардне девијације, корелације, регресионе анализе и примена тих метода у изучавању разних људских карактеристика – висине, тежине, дужине трепавица, између осталог.[28] Пирсон је развио Пирсонов продуктно-моментни коефицијент корелације, дефинисан као продукт-момент,[29] метод момента за одређивање дистрибуције узорака и Пирсонову дистрибуцију, а направио је и низ других доприноса.[30] Галтон и Пирсон су засновали часопис , као први часопис за математичку статистику и биостатистику (која се у то време звала биометрија), и Пирсон је касније основао први универзитетски статистички департман на свету при Лондонском универзитетском колеџу.[31]
Роналд Фишер је формулисао термин нулте хипотезе у контексту експеримента дегустације чаја, која „никад није доказана или установљена, али ју је могуће оповргнути, у току експеримената“.[32][33]
Други талас је током 1910-их их 20-тих иницирао Вилијам Госет, и достигао је своју кулминацију у увидима Роналда Фишера, који је написао уџбенике који су дефинисали ову академску дисциплину на универзитетима широм света. Фишерове најзначајније публикације су биле: његов семинални чланак из 1918. године Корелација између рођака по претпоставци Меделовског наслеђивања, у коме је први пут кориштен статистички термин, варијанса, његов класични рад из 1925. године Статистички методи за истраживаче и рад из 1935. Дизајн експеримената,[34][35][36][37] у коме је развио ригорозне моделе експерименталног дизајна. Он је произвео концепте довољности, Фишеровог линеарног дискриминатора и Фишерове информације.[38] У његовој књизи из 1930. године Генетичка теорија природне селекције он је применио статистику на разне биолошке концепте као што је Фишеров принцип[39]. А. В. Ф. Едвардс је изјавио да је то „вероватно најпознатија расправа у еволуционој биологији“.[39] Фишер је исто тако разматрао полну селекцију, тзв Фишерову писту,[40][41][42][43][44][45] концепт полне селекције условљене позитивном повратном спрегом ефекта физичког изгледа, који је присутан у еволуцији.
Крајњи талас, у којем је углавном дошло до рафинације ранијих развоја, је проистекао из колаборације између Ергона Пирсона и Џерзи Нејмана током 1930-их. Они су увели концепте грешке „Типа II“, степена теста и интервала поверења. Џерзи Нејман је 1934. показао да је узимање стратификованих случајних узорака генерално бољи метод процене од наменског (квотног) узимања узорака.[46]
У данашње време се статистички методи промењују у свим пољима у којима се доносе одлуке, ради извођења прецизних закључака из сакупљених података и ради доношења одлука имајући у виду неизвесност на бази статистичке методологије. Примена модерних рачунара је омогућила извођење статистичких прорачуна великих размера, као и развој нових метода које не би било практично спроводити ручним путем. Статистика је и даље област активних истраживања, на пример на проблемима анализе великих количина комплексних података.[47]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.