From Wikipedia, the free encyclopedia
Стандардно отстапување (или „стандардна девијација“) е проста мерка за променливоста или дисперзијата во група податоци. Малото стандардно отстапување упатува на тоа дека сите елементи од групата на податоци се многу блиску до средната вредност, додека големото стандардно отстапување упатува на тоа дека групата е широка, со широк опсег на вредности.
На пример, просечната висина на возрасен маж изнесува 180 см со стандардно отстапување од околу 7,5 см. Ова значи дека најголемиот број на мажи (околу 68%, вклучувајќи ја нормалната распределба) имаат висина која варора за 7,5 см во однос на средната (172,5 см - 187,5 см), додека речиси сите мажи (околу 95%) имаат висина која варира за 15 см во однос на средната (165 см - 195 см). Ако стандардното отстапување е нула, тогаш сите мажи се високи точно 180 см. Ако стандардното отстапување е 50 см, тогаш опсегот би бил поширок, па би биле вклучени и мажи со висина од 130 см до 230 см.
Освен тоа, за да се изрази променливоста на популацијата, стандардното отстапување вообичаено се применува за да се измери довербата во статистичките заклучоци. На пример, можната грешка во податоците прибрани од анкета е условена од пресметувањето на очекуваното стандардно отстапување во реазултатите, ако анкетата била повторена повеќепати. (Обично можната грешка во податоците прибрани со анкетата е двапати поголема од стандардното отстапување, полупречник од 95% во интервалот на веројатноста.) Во науката, истражувачите обично го пресметуваат стандардното отстапување од ексериментални податоци и влијанието на податоците кои отстапуваат надвор од опсегот на стандардното отстапувње се наречени статистички значајности. Стандардното отстапување е знчајно и во финансиите, каде стандардното отстапување од стапката на враќање на инвестициите претставува ризик.
Формулирано од Френсис Галтон во доцните 1860-ти,[1] стандардното отстапување останало најдобра мерка за мерење на статистичката дисперзија. Корисно својство на стандардното отстапување е тоа што, за разлика од варијансата, се изразува во исти единици како и податокот.
Само кога примерокот од податокот од статистичката популација е даден, стандардното отстапување на популацијата може да се пресмета со формулата за пресметување на стандардното отстапување од примерок, објаснето подолу.
Ги разгледуваме следните податоци:
Дадени се вредности на 8 податоци, со средна вредност (просек) еднаква на 5:
За да се пресмета стандардното отстпаување, потребно е да се пресмета разликата на вредноста на секој податок со средната вредност и истата да се квадрира:
По ова, потребно е да се најде квадратен корен од збирот на овие вредности, што го дава стандардното отстапување:
Поради тоа, низата од податоци дадена горе има стандардно отстапување еднакво на 2.
Нека X е случајна променлива со средна вредност μ:
Овде со E е обележана очекуваната вредност од X. Тогаш стандардното отстапување од X се пресметува со формулата:
Стандардното отстапување σ е квадратен корен од просечната вредност од (X – μ)2.
Во случаите каде X поприма различни вредности од низата на податоци , стандардното отстапување е
или со употреба на ознаката за сума,[2]
Стандардното отстапување од (униваријанта) распределба на веројатноста е исто како и при распределбата на случајна променлива. Не сите случајни променливи имаат стандардно отстапување, бидејќи очекуваните вредности не мора да постојат. На пример, стандардното отстапување од случајна променлива, коешто според Кошиевата распределба е недефинирано за E(X) е недефинирано.
Непрекинатите распределби обично имаат формула за пресметување на стандардното отстапување како функција од параметрите на неговата дистрибуција. Главно, стандардното отстапување е случајна променлива со реална вредност X со функцијата на распределба на веројатноста p(x) е
каде
и каде интегралите се определени за x во опсег поголем од оној за X.
Стандардното отстапување на прекината случајна променлива е квадратно-средно отстапување од неговите средни вредности.
Ако случајната променлива X поприма вредности од N (каде што се реални броеви) со еднаква веројатност, тогаш неговото стандардно отстапување σ може да се пресмета на следниот начин:
Пресметката може да се прикаже со следната формула:[3]
каде е аритметичка средина од xi, пресметана со:
Ако сите вредности немаат еднаква веројатност, но веројатноста од вредноста xi е еднаква на pi, стандардното отстапување може да се пресмета со:
каде
и N' е бројот на елементи различни од нула.
Стандардното отстапување од групирани податоци е исто како и кај прекината случајна променлива, кое точно ја одредува вредноста од групираните податоци, каде точната вредност за секој податок е пропорционална со мноштвото групирани.
Да претпоставиме дека сакаме да го најдеме стандардното отстапување од групирани податоци, во кои спаѓаат вредностите 3, 7, 7 и 19.
Чекор 1: се пресметува аритметичка средина (просек) од 3, 7, 7 и 19.
Чекор 2: се пресметува отстапувањето на секоја вредност од просекот
Чекор 3: сите отстапувања се квадрираат, што го зголемува збирот на отстапуивањата, правејќи ги негативните вредности позитивни.
Чекор 4: се пресметува збир на квадрираните отстапувања
Чекор 5: се пресметува позитивен квадратен корен од збирот на квадрираните отстапувања
Така, стандардното отстапување од групата на податоци е 6. Овој пример покажува и дека стандардното отстапување има различна вредност од средното апсолутно отстапување (кое во овој пример изнесува 5).
Се забележува дека горната група на податоци претставува само примерок од популација, модификувано стандардно отстапување од стандардното отстапување на ова популација, кое изнесува 6,93.
Пресметувањето на збирот од квадрираните отстапувања може да се поедностави на следниот начин:
Со замена во стандардната формула, се добива:
Во светот на реалноста, да се пресмета стандардното отстапување од целата популација е нереално, освен во неколку исклучителни случаи, како стандардизираниот тест, каде секој број од популацијата е примерок. Во најголем број на случаи, стандардното отстапување се пресметува со користење на случаен примерок, одбран од популацијата. Со користење на горенаведеното за групирани податоци и со негова примена на помал или примерок со умерени модификации резултира во пресметката, која има тенденција на опаѓање: тоа е тенденција на проценка. Најкористена мерка е стандардото отстапување од примерокот, кое е дадено со
каде е примерок и е средна вредност на примерокот. Оваа исправка (примената на наместо ) е позната како Беселова исправка. Се забележува дека од дефинирањето на стандардното отстапување, „стандардното отстапување на примерок“ користи , додека поимот „просто стандардно отстапување“ се користи за поправената пресметка (со примена на ). Именителот N − 1 може интуитивно да се протолкува како број на степени на слобода во вектор од остатоците, .
Причината за оваа дефиниција е тоа дека s2 е тенденција на проценка за варијансата σ2 од главнаата популација, ако постои варијанса и вредностите се независно распределени. И покрај тоа, s не е тенденција на проценка за стандардното отстапување σ; тоа има тенденција да го потцени стандардното отстапување на популацијата. Иако тенденцијата на проценка за σ е познато кога случајната променлива е нормализирано распределена, формулата е сложена и доведува до мала исправка: видете тенденција на проценка на стандардно отстапување. И покрај тоа, не е секогаш посакувано; видете тенденција на проценка.
Друга проценка, која понекогаш се употребува во истиот случај, „стандардното отстапување од примерок“:
Оваа форма има еднакво помала средна квадратна грешка од тенденцијата на проценка, и е проценка на максималната веројатност, кога популацијата е нормализирано распределена.
За константата c и случајните променливи X и Y:
каде и имаат оделно варијанса и коваријанса.
Големото стандардно отстапување значи дека вредностите на податоците се далеку од средната вредност, а помалото стандардно отстапување значи дека тие се поблиску до средната вредност.
На пример, секоја од трите популации {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8} има средна вредност 7. Нивните стандардни отстапувања се 7, 5 и 1. Третата популација има многуи помало отстапување од останатите две, бидејќи вредностите на податоците од оваа популација се најблиску до 7. Со други зборови, стандардното отстапување ни кажува на каква оддалеченост од средината се наоѓаат вредностите на податоците од популацијата. Тоа се изразува во иста единечна мерка како и податоците. Ако, на пример, групата на податоци {0, 6, 8, 14} претставува временски период во години од популацијата, тогаш и стандардното отстапување, кое изнесува 5 ќе претставува временски период во години.
Друг пример е популацијата {1000, 1006, 1008, 1014}, која ги претставува должините истрчани од страна на четири атлетичари измерена во метри. Средната вредност изнесува 1007 метри, а стандардното отстапување 5 метри.
Стандардното отстапување може да служи како мерка за неопределеност. Во физиката, на пример, добиеното стандардно отстапување од група на величини со повторување треба да даде прецизност на овие величини. Во случај величините да се во согласност со теоретските предвидувања, стандардното отстапување од овие величини е од особено значење: ако средната вредност на величините отстапува премногу од предвидувањата (со оддалечување мерено со стандардно отстапување), тогаш теоријата којашто била испробана најверојатно треба да биде поправена. Ова има смисла, бидејќи величините се наоѓаат надвор од опсегот на вредности, кои последично би се појавиле, ако предвидувањата беа точни, а стандардното отстапување соодветно (видете интервал на предвидување).
Стандардното отстапување може да се протолкува, како одговор на прашањето, колку многу варијации има од просекот (средната вредност).
Како едноставен пример, се семат просечната температура во градовите. Доколку два града имаат просечна температура од 15 °C, потребно еда се укаже на тоа дека опсегот на движење на температурата е помал во крајбрежните отколку кај континенталните градови. Тоа значи дека отстапувањата од просечната температура се поголеми кај контненталните отколку кај крајбрежните градови.
Па, така просечната температура од 15 °C се јавува и кај град со максимална температура од 25 °C, а минимална 5 °C, но и кај град со максимална температура од 18 °C и минимална од 12 °C. Стандардното отстапување ни овозможува даго одредиме градот, во кој температурата се движи во помал интервал и градот во кој се движи во поголем интервал.
Друг начин да се согледа стандардното отстапување е разгледувањето на спортските екипи. Постојат екипи од сите категории. Некои се посилни в нешто, а некои послаби. Екипите кои се на првите позиции на табелата не покажуваат големи разлики и е полесно да се предвиди нивната игра. Со нивната игра, стандардното отстапување е многу мало. Од друга страна, мало е и стандардното отстапување во играта на екипите, кои се наоѓаат на последните позиции од табелата, па и нивната игра полесно се предвидува. Во овој случај, големото стандардно отстапување во играта е карактеристично за екипите од средината на табелата. Нивната игра е променлива и тешко предвидлива. Тоа е поради голем број на фактори, но најчесто се наведува комбинацијата на силен напад и слаба одбрана.
Во тркачките спортови, времето на еден возач се мери со последователните извозени кругови. Возачот со помало стандардно отстапување е подоследен од оној со поголемо стандардно отстапување. Оваа информација може да се искористи за да се разбере, каде може да се најдат можностите за намалување на времето по извозен круг.
Во финансиите, стандардното отстапување е претстава на ризикот при осигурувањето (стока, имот итн.) или ризикот при портфолио осигурувањето (заеднички средства). Ризикот е значаен фактор во одредувањето на успешното управување со портфолиото инвестиции, бидеји тоа ја одредува варијацијата во враќањата на имотот или портфолиото и на инвеститорите и дава математичка основа при донесувањето на инвестиционите одлуки (познато како средноваријансна оптимизација). Целиот концепт е во тоа што со зголемување на ризикот, се зголемува и очекуваното враќање, како резултт на зголемениот ризики. Со други зборови, инвеститорите може да очекуваат поголемо заработка, доколку инвестицијата е поризична. При инвестирањето, инвеститорите треба да ја проценат стапката на враќање на средствата и неизвесноста на идните настани. Стандардното отстапување овозможува квантитативна проценка на неизвесноста на идните враќања.
На пример, да кажеме дека инвеститорот може да избере меѓу две можности. Можноста А, според искуството од минатите 20 години нуди враќање на средствата од 10%, со стандардно отстапување од 20% можност Б, која за истиот период овозможува враќање од 12%, но поголемо стандардно отстапување од 30%. Во основа на ризикот и враќањето, инвеститорот може да ја избере можноста A како посигурен избор, бидејќи додатните процентутални 2 бода на враќање не се вредни колку дополниотелните 10% стандардно отстапување (поголем ризик на идното враќање). Поради тоа, веројатно е да отпадне можноста Б. Во овој пример, можноста А се очекува да донесе врачање околу 10%, плус или минус 20% (опсег од 30% до -10%), околу две третини од идните годишни враќања. Дколку се разгледуваат поекстремни осттапувања во враќањата во иднина, инвеститорот може да очекува средства од 10%, плус или минус 90%, или опсег од 100% до -80%, што вклучува издатоци за три различни стандардни отстапувања за идното враќање (околу 99,7% од веројатните враќања).
Пресметувајќи го просечното враќање (аритметичка средина) од посигурната можност се зголемува бројот на периоди, кој е потребен за враќање на вложените средства. Разликата од враќањето и очекуваното враќање за еден период ја претставува варијансата. Со коренување на варијансата се добива стандардното отстапување, кое го претставува ризикот, оствареното враќање да биде со помала или поголема разлика од очекуваното. Поголемата вредност на варијанста, претставува и поголемо стандардно отстапување , а со тоа и поголем ризик. Пресметување на средната вредност од коренуваните варијанси резултира со пресметување на просечниот ризик при врачањето на вложените средства. Квадратниот корен од варијансата резултира со стандардното остстапување од инвестицијата дадена во овој пример.
За да се навлезе во геометријата, нека бидат дадени популации со три вредности, x1, x2, x3. Оваа одредува точка P = (x1, x2, x3) во R3. Дадена е линијата L = {(r, r, r) : r in R}. Ова е „главната дијагонала“. Ако сите три дадени вредности се еднакви, тогаш стандардното отстапување ќе биде 0 и точката P ќе лежи на линијата L. Така, може да се потврди дека стандардното отстапување е поврзано со одредувањето на растојанието на точката P со линијата L. Со ортагонално движење на точката P до линијата L, се доаѓа до тоќката:
чии координати се средни вредности на вредности на точките кои беа дадени. Ова покажува дека растојанието меѓу точките P и R (што е идентично со растојанието од точката P и линијата L) е дадено со σ√3. Слична е и формулата (со 3 распределби на N) за популација со N вредности, кога се работи со RN.
Набљудувањето е поретко од неколку стандардни отстапувања оддалечени од средната вредност. Чебишовото неравенство ги наложува следниве граници за сите распределби за кои стандардното отстапување е одредено.
И најважното:
Централната гранична теорема кажува дека распределбата од збир на многу независни, идентично распределени случајни променливи е во правец на нормалната распределба. Ако распределбата на податоците е отприлика нормална, тогаш околу 68% од вредностите се во границите на 1 стандардно отстапување од средната вредност (матеатички, μ ± σ, каде μ е аритметичката средина), околу 95% од вредностите се во границите на две стандардни отстапувања (μ ± 2σ) и околу 99,7% лежат со 3 стандардни отстапувања (μ ± 3σ). Ова е познато како сигма правило или емпириско правило.
За различни вредности на z, процентуалнотоочекување за вредностите да лежат на симетричниот интервл на доверба (−zσ,zσ) се следните:
zσ | % |
---|---|
1σ | 68,2689492% |
1,645σ | 90% |
1,960σ | 95% |
2σ | 95,4499736% |
2,576σ | 99% |
3σ | 99,7300204% |
3,2906σ | 99,9% |
4σ | 99,993666% |
5σ | 99,99994267% |
6σ | 99,9999998027% |
7σ | 99,9999999997440% |
Средната вредност и стандардното отстапување од група на податоци обично се поврзуваат. Инаку, стандардното отстапување е „природна“ мерка на статистичката дисперзија, ако центарот на податокот се мери како средина. Ова е така, поради тоа што стандардното отстапување е многу омало за вредност блиска до средната, отколку било која друга. Точно тврдење е следното: да претпоставиме дека x1, ..., xn се реални броеви, кои ја определуваат функцијата:
Користејќи ја математичката анализа, или едноставно разложувајќи го биномот на квадрат, можно е да се докаже дека σ(r) има единствена минимална вредност во средната:
Коефициентот на варијација од примерок е однос на стандардното отстапување и средната вредност. Тоа е бездимензионална величина, којашто може да се употреби за да се спореди износот на варијансата меѓу популациите со различни средни вредности.
Ако сакаме да ја добиеме средната вредност со одмерување на распределбата, тогаш стандардното отстапување од средната вредност е поврзано со стандардното отстапување на распределбата:
каде N е бројот на примероци употребени за одмерување на средната вредност.
Побрз начин за пресметување на стандардното отстапување од популација е следнава формула (низ разгледувањата мора да биде направено во услови на заокружена грешка, аритметички прилив и аритметички одлив):
Следните две формули се корисни за претставување на континуираното стандардно отстапување. Групата од три големи суми s0,1,2 се секоја пресметана од групата од N вредности за x, обележано како xk. Од добиените резултати од овие три суми, едната може да се користи како за пресметување на тековната вредност на континуираното стандардно отстапување. Оваа вешта дефиниција за sj ни овозможува лесно да ги претставиме двете различни фази (собирањето на sj и пресметувањето на ). Треба да се забележи дека s0 ја зголемува вредноста на x до нула и кога x0, тоа е секогаш 1, а кога s0 се проценува до N.
каде големите суми s0, s1, s2 се одредени со
Во воведувањето во компјутерска обработка, како што трите суми sj стануват поголеми, потребно е да се разгледаат заокружената грешка, аритметичкиот прилив и ариметичкиот одлив. За да се избегне ова, треба периодично да се намалуваат нивните апсолутни вредности во процес кој потсетува на нормализација на единечен вектор. Додека s1 е сума на вредности, s2 е сума на квадрати, овие вредности може да се пресметаат за помали вредности на N, едноставно со делење на дадената вредност за N и со множење на избраното ново N. Споредбата со единечниот вектор е охрабрување во изборот на бројот 1 како вредност на новото N. И покрај тоа, ова е делумно залуден избор, бидејќи точноста за континуираната приближна пресметка е можна само за големи вредности на N, и ова придонесува, следнтаа вредност да се пресметува потешко, отколку претходните. Посоодветна вредност од новото N е максималната вредност, којашто може повторно да се нормализира во ново N, повторно пред N да поприми големи вредности и да предизвика грека (дури и катастрофа), поради додавање на пвеќе вредности.
Слично е за стандардното отстапување на примерок:
Или континуираните суми:
Горниот метод може да биде многу чувствителен на заокружување, приливни и одливни грешки, посебно кога вредностите на примерокот се блиску до средната вредност. Тоа може да даде негативни вредности за стандардното отстапување, коешто не е можно да не биде дадено според дефиницијата. Овој метод е наведен и во многу учебници. И покрај тоа, тој не се употребува. Подолу е даден подобар метод за пресметување на континуираните суми, метод со намалени грешки со заокружување:
каде А е средната вредност.
варијанса на примерок:
стандардна варијанса
За немерлива распределба, малку е посложено: Средната вредност е да дена со:
каде се немерливи величини
каде n е вкупниот број на елементи, а n' е бројотна елементи со немерливи велилини различни од нула. Горенаведените фрмули стануват идентични со поедноставните формули, доколку сите вредности што се земаат за немерливите величини се еднакви на 1.
|
|
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.