Loading AI tools
分散の正の平方根 ウィキペディアから
標準偏差を2乗したのが分散であり、従って、標準偏差は分散の非負の平方根である[1]。標準偏差が 0 であることは、データの値が全て等しいことと同値である。
母集団や確率変数の標準偏差を σ で、標本の標準偏差を s で表すことがある。
二乗平均平方根 (RMS) を用いると、標準偏差は偏差の二乗平均平方根に等しくなる。
データ x1, x2, …, xn の平均値からの散らばり具合を数値にした標準偏差は、次の式で定義される:
ここで x は平均値を表す。この定義は、データを数ベクトルと見て、「散らばり具合」を偏差ベクトルのユークリッドノルムととらえる考えに基づく(このことより平均偏差でなく自乗平均をとる)。
標準偏差は平方根を取るため、簡単な計算法則が成り立ちにくいという特徴がある。そこで分散 s2 を
で定義する。分散には簡単な計算法則がいくつか成り立つことから、種々の標準偏差ができるようになる。
標準偏差の概念は、イギリスの統計学者フランシス・ゴルトンにより、親子の身長の相関関係を調べる中で初めて見出された[2]。データを数ベクトルと見る考え方は相関係数の導入と命名につながった。ゴルトンはこれらの研究により平均への回帰という現象を見出した[3]。
ユニヴァーシティ・カレッジ・ロンドンのゴルトン研究室を継承した[4]カール・ピアソンはゴルトンの研究を定式化[2]、体系化し[5]、初めて "standard deviation"(「標準偏差」)と名付けた[6][7][8]。
確率分布において最も基本となる正規分布曲線において、変曲点の x座標と平均の絶対差は標準偏差に等しくなる。このことから、標準偏差は信頼区間の基本的な単位となる。
日本の受験業界で広く使われている学力偏差値は標準偏差の応用例の一つで、異なる試験でも、平均点よりどれだけ離れているかをある統一した尺度でとらえることができるようになっている。
母集団全てのデータ x1, x2, …, xn に対して、平均値 x は次の式で定義される:
この平均値 x を使って得られる分散 σ2 を次の式で定義する:
σ2 を母分散と言うこともある。
この分散の非負の平方根 σ を、母集団の標準偏差と定義する[11]。分散もデータの散らばり具合を表す統計量であるが、分散と違い標準偏差はデータの値と次元が等しくなる。偏差は平均的には標準偏差の分だけ離れていると考えることができる[12]。
母集団の中から、大きさ n(母集団の大きさよりはるかに小さい)の標本 x1, x2, …, xn を抽出したとする。このとき、標本平均は次の式で表される:
この標本平均を使って次式で定義される量を標本分散と呼ぶ:
標本分散の平方根 s を標本標準偏差と呼ぶ[11]。
σ2 を母分散、s2 を標本分散とすると、標本分散の期待値 E[s2] は、
となることが示される。つまり、標本分散は母分散よりも少し小さくなる[注釈 1]。そのため、標本分散は母分散の不偏推定量ではない。そこで、
を考えると、この量の期待値は母分散に等しく、母分散の不偏推定量になっている。
こうして定義される v2 を不偏分散という。v を不偏標準偏差という。
紛らわしいが、 v2 を標本分散と呼ぶこともある。さらに v2 の平方根 v を標本標準偏差ということもある。名称の混乱については後述する。
前述のように不偏分散は、母分散の不偏推定量である(標本から測定した推定量の期待値が母分散に等しい)。しかし、不偏分散の平方根 v は、母集団の標準偏差の不偏推定量ではない。
母集団が正規分布に従う場合、母集団の標準偏差の不偏推定量 D は次式で与えられる[13]:
ここで、Γ はガンマ関数、v2 は不偏分散である。
標本の大きさが大きくなれば、母集団の標準偏差の不偏推定量 D は、近似的に、平均からの偏差平方和を n − 1.5 で割った値の平方根として求められる[14]:
統計の教科書によっては、不偏分散(分母が n − 1 の方)を「標本分散」と呼んでいる場合もあり[15]、用語が混乱して使用されている場合がある。母平均が不明で、代わりに標本平均を使用する場合には、期待値が母分散となる不偏分散を使用することが多い[16]。
英語では不偏分散による標準偏差のことを「sample standard deviation」(標本標準偏差)と呼ぶことが多い。この語はカール・ピアソンによって1893年に導入された[17]。ただし不偏分散による標準偏差を意味する英語の表現には混乱がある。
日本語の「不偏標準偏差」という語にも混乱がある。日本の大学教授の間でも、不偏分散 v2 の平方根を、不偏標準偏差だと教える大学教員も多いが、母集団の標準偏差の不偏推定量 D を不偏標準偏差だと教える教員もいる。
このように、同じ用語でも話者によって定義が異なる場合がある。
表計算ソフトでは次のようなワークシート関数が用意されている。
分母 | Microsoft Excel Googleスプレッドシート | Lotus 1-2-3 |
---|---|---|
n | STDEVP , STDEVPA , STDEV.P | |
n − 1 | STDEV , STDEVA , STDEV.S | @STD , @STDS |
X を離散型確率変数とする。X のとりうる値を x1, x2, …, xn, … とし、X が xi をとる確率を pi で表す。このとき
である。このとき
を確率変数 X の期待値という。また、
X を連続型確率変数とする。X の値が区間 [x1, x2] に属する確率が、連続関数 f(x) を用いて
と表せるとき、f(x) を X の確率密度関数という。このとき
である。このとき
を確率変数 X の期待値という。また、
母標準偏差が未知のときは、標本から得られた標本標準偏差から推定することができる。母標準偏差を σ、大きさ N の標本の標準偏差を s とすると、母集団分布が正規分布ならば σ2 は次の自由度 N − 1 の χ2 分布に従う。
σ の95%信頼区間は P = 0.975 の χ2 から P = 0.025 の χ2 までの範囲で、s と σ の比は N = 5 では 0.31 から 1.49、N = 20 では 0.67 から 1.28 となり、標本が小さい場合はかなり範囲が広いことに留意すべきである。
信頼区間 | 信頼度 | 不信頼度 | |
---|---|---|---|
百分率 | 百分率 | 分数 | |
0.318639σ | 25% | 75% | 3/4 |
0.674490σ | 50% | 50% | 1/2 |
0.994458σ | 68% | 32% | 1/3.125 |
1σ | 68.2689492% | 31.7310508% | 1/3.1514872 |
1.281552σ | 80% | 20% | 1/5 |
1.644854σ | 90% | 10% | 1/10 |
1.959964σ | 95% | 5% | 1/20 |
2σ | 95.4499736% | 4.5500264% | 1/21.977895 |
2.575829σ | 99% | 1% | 1/100 |
3σ | 99.7300204% | 0.2699796% | 1/370.398 |
3.290527σ | 99.9% | 0.1% | 1/1000 |
3.890592σ | 99.99% | 0.01% | 1/10000 |
4σ | 99.993666% | 0.006334% | 1/15787 |
4.417173σ | 99.999% | 0.001% | 1/100000 |
4.5σ | 99.9993204653751% | 0.0006795346249% | 1/147159.5358 = 3.4/1000000 |
4.891638σ | 99.9999% | 0.0001% | 1/1000000 |
5σ | 99.9999426697% | 0.0000573303% | 1/1744278 |
5.326724σ | 99.99999% | 0.00001% | 1/10000000 |
5.730729σ | 99.999999% | 0.000001% | 1/100000000 |
6σ | 99.9999998027% | 0.0000001973% | 1/506797346 |
6.109410σ | 99.9999999% | 0.0000001% | 1/1000000000 |
6.466951σ | 99.99999999% | 0.00000001% | 1/10000000000 |
6.806502σ | 99.999999999% | 0.000000001% | 1/100000000000 |
7σ | 99.9999999997440% | 0.000000000256% | 1/390682215445 |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.