컴공 일기266
게시글 주소: https://wwww.orbi.kr/00071460551
n이 충분히 크고 적당한 λ가 존재해서 np = λ 라면, 이항분포 B(n,p)를 포아송 분포 POI(λ)로 근사시킬 수 있습니다.
사실 이항분포는 개별 시행마다 성공 확률과 실패 확률을 세세하게 따지기 때문에, 확률을 계산함에 있어서 복잡합니다.
특히 n값이 커지면 커질수록 그렇지요.
포아송 분포의 장점은, 이항분포처럼 개별 시행마다의 확률을 따지지 않고, 단위시간 / 구간 당 평균적으로 몇 번을 성공했는지만 따져도 적확한 확률을 구할 수 있다는 것에 있습니다. 또한, 이항 분포는 시행횟수 n과 확률 p를 매번 조정하면서 확률을 계산해야 하지만, 포아송 분포의 경우는 모수(λ)를 적절하게만 변환시켜 주어도 단번에 값을 구할 수 있죠.
예를 들어, 어떤 일을 독립시행한 횟수가 100번이고 어떤 일이 일어날 확률 P = 0.01이라고 가정합시다.
또 그 일이 2번 성공할 확률을 구한다고 가정해보죠.
그러면 X~B(100, 0.01)이고 시행은 독립적이므로 100C2 * (0.01)^2 * (0.99)^98
이 됩니다. 확률을 구하기는 했지만, 이 값이 대략적으로 얼마 즈음인지 단번에 파악하기가 쉽지 않죠.
하지만 시행횟수가 충분히 크므로 포아송 분포를 적용할 수 있는데, 이런 경우 조금 더 쉽게 구할 수 있습니다.
POI(λ) = x! / e^-λ * (λ)^x (x : 성공한 횟수, λ : 모수)
여기서 λ = np = 100 * 0.01 = 1
POI(1) = 2! / e^-1
e^-1 ~= 0.3679 정도 되므로 확률이 대략 0.1839 정도라는 사실을 알 수 있습니다.
포아송 분포의 확률질량함수식이 비교적 이항분포 확률질량함수식보다 계산하기 용이하다는 장점도 있지만,
이 분포의 가장 큰 강점은 유연성에 있습니다. λ를 자유롭게 잡을 수 있거든요. 하루 평균, 일주일 평균,
1년 평균… 원하는 값을 조정해 줄 수 있기 때문에 개별 시행에 집착하는 이항 분포보다는 조금 더 현실적인
분포라고도 볼 수 있겠습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
첫번째 댓글의 주인공이 되어보세요.