사건이 일어날 확률을
, 일어나지 않을 확률을
라 할 때,
번의 시행중에서 사건이
번 일어날 확률은 다음과 같다.
![{\displaystyle \operatorname {P} (n)={N \choose n}{p^{n}}{q^{(N-n)}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/c4ab8c5ecef1fad4043978de7dec0db2dc28220b)
이 확률분포가 결국
이 상당히 커지면, 이 확률분포는 거의 연속적이라고 볼 수 있다.
연속적인 분포에서의
에서 연속적인 확률밀도함수가 극대값을 가지게 된다면, 다음의 식을 만족하게 된다.
![{\displaystyle \left({\frac {\partial \operatorname {P} }{\partial n}}\right)_{{n}={\bar {n}}}=0}](//wikimedia.org/api/rest_v1/media/math/render/svg/d2f78d0b7d40bc4aaf4c928ddc2edd4f0917590a)
로그 함수는 단조증가 함수이므로, 다음의 식도 만족하게 된다.
![{\displaystyle \left({\frac {\partial \ln {\operatorname {P} }}{\partial n}}\right)_{{n}={\bar {n}}}=0}](//wikimedia.org/api/rest_v1/media/math/render/svg/e0b61656d3605fcf999284cdab95466315b8baff)
충분히 작은
에 대하여
라 정의하고
근처에서
에 대하여 테일러 전개하면 다음과 같다.
![{\displaystyle \ln {\operatorname {P} (n)}=\ln {\operatorname {P} ({\bar {n}})}+{B_{1}}{\eta }+{\frac {1}{2}}{B_{2}}{\eta }^{2}+{\frac {1}{6}}{B_{3}}{\eta }^{3}+\dots }](//wikimedia.org/api/rest_v1/media/math/render/svg/5c6b32a800ce24ac8a9863d2b515d146f559656e)
여기서 이미
이므로, 0이 된다는 걸 알 수 있다. 또한
가 충분히 작으므로, 다음과 같이
에 대한 2차식으로 근사할 수 있다.
![{\displaystyle \ln {\operatorname {P} (n)}\approx \ln {\operatorname {P} ({\bar {n}})}+{\frac {1}{2}}{B_{2}}{\eta }^{2}}](//wikimedia.org/api/rest_v1/media/math/render/svg/296f53b4c87146d8929dc5f58b961036fed6e3fa)
양변에 로그를 풀어서 원래 모양으로 만들어주면 다음과 같다.
![{\displaystyle \operatorname {P} (n)=\operatorname {P} ({\bar {n}})e^{{\frac {1}{2}}{B_{2}}{(n-{\bar {n}})}^{2}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/6fa286982101ce8093697573d8c663b4dc994609)
여기서,
이므로 이것을 바탕으로 스털링 근사를 이용하여
을 구해보면,
![{\displaystyle {\frac {\partial \ln {\operatorname {P} }}{\partial n}}=-\ln {n}+\ln {(N-n)}+\ln {p}-\ln {q}}](//wikimedia.org/api/rest_v1/media/math/render/svg/8433a327393385ee4f78d52a64b29d903cca057d)
![{\displaystyle {\frac {(N-{\bar {n}})}{\bar {n}}}{\frac {p}{q}}=1}](//wikimedia.org/api/rest_v1/media/math/render/svg/9ecd89dcd245f88d541b16106580608721ce8ca1)
![{\displaystyle \therefore {\bar {n}}=Np=m}](//wikimedia.org/api/rest_v1/media/math/render/svg/286535394a87d25ad8ac17eb942741cdab63fb88)
은 평균이 됨을 알 수 있다.
이제
를 구해보면, 다음을 얻는다.
![{\displaystyle {\frac {\partial ^{2}\ln {\operatorname {P} }}{\partial ^{2}n}}=-{\frac {1}{n}}-{\frac {1}{N-n}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/0db977426cb7a891ef8a324312f275ee5961fd14)
![{\displaystyle {B}_{2}=-{\frac {1}{Np}}-{\frac {1}{Nq}}=-{\frac {p+q}{Npq}}=-{\frac {1}{Npq}}=-{\frac {1}{\sigma ^{2}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/bf55f6a600d866ed7a29c9b5017ee27e97821885)
그렇다면 확률밀도함수는 다음과 같이 쓸 수 있다.
![{\displaystyle \operatorname {P} (n)={A}{e^{-{\frac {(n-m)^{2}}{2\sigma ^{2}}}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/01fe5f6808fe2d3b201b24b194136012d9849c27)
이 확률밀도 함수를 표준화시키면 최종적인 확률밀도 함수를 얻을 수 있다.
![{\displaystyle \operatorname {P} (n)={\frac {1}{{\sqrt {2\pi }}\sigma }}{e^{-{\frac {(n-m)^{2}}{2\sigma ^{2}}}}}}](//wikimedia.org/api/rest_v1/media/math/render/svg/dd1342af119e246ece8d4a1325be45efffd64535)
따라서
는
이 충분히 커질 때(보통 Np>5, Nq>5일 때),
로 근사할 수 있다.