Standardavvikelse eller standarddeviation är ett statistiskt mått på hur mycket de olika värdena för en population avviker från medelvärdet . Om de olika värdena ligger samlade nära medelvärdet blir standardavvikelsen låg, medan värden som är spridda långt över och under medelvärdet bidrar till en hög standardavvikelse. Standardavvikelser används inom statistik, forskning och matematisk statistik .
Diagram över en normalfördelning , där varje färgat band har en bredd lika med en standardavvikelse σ. De mörkaste bandens area representerar sannolikheten (cirka 68 %) för att ett slumpmässigt utfall befinner sig inom en standardavvikelse från medelvärdet
Animation som visar ett, två samt tre standardavvikelser (SD) från medelvärdet på en påhittad datamängd.
Låt X vara en stokastisk variabel med medelvärdet μ enligt
E
[
X
]
=
μ
{\displaystyle \operatorname {E} [X]=\mu }
där operatorn E betecknar medelvärdet eller väntevärdet av X . Då är standardavvikelsen av X
σ
=
E
[
(
X
−
μ
)
2
]
=
E
[
X
2
]
−
(
E
[
X
]
)
2
{\displaystyle \sigma ={\sqrt {\operatorname {E} [(X-\mu )^{2}]}}={\sqrt {\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}}}}
Variansen för X definieras som
Var
(
X
)
=
E
[
(
X
−
μ
)
2
]
{\displaystyle \operatorname {Var} (X)=\operatorname {E} [(X-\mu )^{2}]}
och således är standardavvikelsen σ (sigma ) kvadratroten ur variansen för X , det vill säga är kvadratroten ur medelvärdet av (X − μ )2 .
En fördel med kvadratrotsbildningen är att standardavvikelsen fås i samma enhet som mätvärdena.
Diskret slumpvariabel
Om X består av slumpvisa värden x 1 , x 2 , ..., xN , med likformig sannolikhetsfördelning , är standardavvikelsen för dessa
σ
=
1
N
(
(
x
1
−
μ
)
2
+
(
x
2
−
μ
)
2
+
⋯
+
(
x
N
−
μ
)
2
)
{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\left((x_{1}-\mu )^{2}+(x_{2}-\mu )^{2}+\cdots +(x_{N}-\mu )^{2}\right)}}}
där
μ
=
1
N
(
x
1
+
⋯
+
x
N
)
{\displaystyle \mu ={\frac {1}{N}}(x_{1}+\cdots +x_{N})}
eller, med annan notation
σ
=
1
N
∑
i
=
1
N
(
x
i
−
μ
)
2
;
μ
=
1
N
∑
i
=
1
N
x
i
.
{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}};\qquad \mu ={\frac {1}{N}}\sum _{i=1}^{N}x_{i}.}
Detta är korrekt om de N värdena utgör hela populationen. Om däremot värdena är en delmängd av en större population och används som estimat av den större populationen är stickprovets standardavvikelse
s
=
1
N
−
1
∑
i
=
1
N
(
x
i
−
μ
)
2
{\displaystyle s={\sqrt {{\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}}}
ett bättre estimat (Bessels korrektion ) eftersom den då blir väntevärdesriktig .[1] [2]
Om sannolikhetsfördelningen inte är likformig, antag att x k har sannolikheten p k och standardavvikelsen kan i detta fall skrivas
σ
=
∑
i
=
1
N
p
i
(
x
i
−
μ
)
2
;
μ
=
∑
i
=
1
N
p
i
x
i
{\displaystyle \sigma ={\sqrt {\sum _{i=1}^{N}p_{i}(x_{i}-\mu )^{2}}};\qquad \mu =\sum _{i=1}^{N}p_{i}x_{i}}
Kontinuerlig slumpvariabel
Standardavvikelsen för en kontinuerlig stokastisk variabel X med täthetsfunktionen p (x ) är
σ
=
∫
X
(
x
−
μ
)
2
p
(
x
)
d
x
{\displaystyle \sigma ={\sqrt {\int _{\mathbf {X} }(x-\mu )^{2}\,p(x)\,dx}}}
med
μ
=
∫
X
x
p
(
x
)
d
x
{\displaystyle \mu =\int _{\mathbf {X} }x\ p(x)\ dx}
där integralerna är begränsade och där x antar alla värden som är möjliga för den stokastiska variabeln X .
Antag att en population utgörs av
2
,
4
,
4
,
4
,
5
,
5
,
7
,
9
{\displaystyle 2,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9}
De åtta datapunkterna har medelvärdet
2
+
4
+
4
+
4
+
5
+
5
+
7
+
9
8
=
5
{\displaystyle {\frac {2+4+4+4+5+5+7+9}{8}}=5}
Först beräknas skillnaden för varje datapunkt och medelvärdet och sedan kvadreras resultaten:
(
2
−
5
)
2
=
(
−
3
)
2
=
9
(
5
−
5
)
2
=
0
2
=
0
(
4
−
5
)
2
=
(
−
1
)
2
=
1
(
5
−
5
)
2
=
0
2
=
0
(
4
−
5
)
2
=
(
−
1
)
2
=
1
(
7
−
5
)
2
=
2
2
=
4
(
4
−
5
)
2
=
(
−
1
)
2
=
1
(
9
−
5
)
2
=
4
2
=
16
{\displaystyle {\begin{array}{lll}(2-5)^{2}=(-3)^{2}=9&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(7-5)^{2}=2^{2}=4\\(4-5)^{2}=(-1)^{2}=1&&(9-5)^{2}=4^{2}=16\\\end{array}}}
Variansen är medelvärdet av dessa värden:
9
+
1
+
1
+
1
+
0
+
0
+
4
+
16
8
=
4
{\displaystyle {\frac {9+1+1+1+0+0+4+16}{8}}=4}
och populationens standardavvikelse är lika med variansens kvadratrot:
4
=
2
{\displaystyle {\sqrt {4}}=2}
Noter
Gunnar Blom, Jan Enger, Gunnar Englund, Jan Grandell, Lars Holst (2017). Sannolikhetsteori och statistikteori med tillämpningar (7:1). sid. 228. ISBN 978-91-44-12356-1
En sammanfattning av ISO/IEC Guide 98-3:2008 ”Uncertainty of Measurement -- Part 3: Guide to the Expression of Uncertainty in Measurement (GUM:1995)” i lantmäterisammanhang .
Wikimedia Commons har media som rör Standardavvikelse .