확률론과 통계학에서 정규 분포(正規 分布, 영어: normal distribution) 또는 가우스 분포(Gauß 分布, 영어: Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 수집된 자료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다.
정규분포는 2개의 매개 변수 평균 와 표준편차 에 대해 모양이 결정되고, 이때의 분포를 로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 을 표준 정규 분포(standard normal distribution)라고 한다.[1]
역사
정규분포는 아브라암 드무아브르가 1733년 쓴 글에서 특정 이항 분포의 이 클 때 그 분포의 근사치를 계산하는 것과 관련하여 처음 소개되었고 이 글은 그의 저서 《우연의 교의》(The Doctrine of Chances) 2판(1738년)에 다시 실렸다. 피에르시몽 라플라스는 그의 저서 《확률론의 해석이론》(Théorie analytique des probabilités)(1812년)에서 이 결과를 확장하였고 이는 오늘날 드무아브르-라플라스의 정리로 알려져있다.
라플라스는 실험 오차를 분석하면서 정규분포를 사용했다. 1805년에는 아드리앵마리 르장드르가 매우 중요한 방법인 최소제곱법을 도입했다. 카를 프리드리히 가우스는 이 방법을 1794년부터 사용해왔다고 주장했는데 1809년에는 실험 오차가 정규분포를 따른다는 가정하에 최소제곱법을 이론적으로 엄밀히 정당화했다.
성질
위에서 첫 번째 적분은 홀함수의 적분으로 0이고 두 번째 적분은 가우스 적분으로 적분값이 로 잘 알려져 있다. 따라서 기댓값은 다.
표준 정규 분포
정규 분포 밀도 함수에서 를 통해 X(원점수)를 Z(Z점수)로 정규화함으로써 평균이 0, 표준편차가 1인 표준정규분포를 얻을 수 있다.[1]
불확실성
에서 k값이 변화함에 따라 구해지는 값을 불확실성(uncertainty)이라고 한다. 예를 들어 를 90% 불확실성, 는 95% 불확실성, 은 99% 불확실성이다. 특히, 를 50% 불확실성이라고 하며, 확률오차(probable error)라고도 한다.[3] 이는 관측값이 전체 관측값의 50%에 있을 확률을 의미한다.[4]
같이 보기
각주
참고 문헌
외부 링크
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.