2.7 The Poisson dist 포아송 분포
2.7 The Poisson dist 포아송 분포.
Definition 10. Poisson process
주어진 연속된 사건에서 어떤 사건의 발생 수가 있다. 그 간격이 카운트된다. 그때 사건이 다음의 조건을 만족하고 람다가 0보다 크다면 근사 푸아송 과정을 갖는다.
a ) 겹치지 않은 하위 구간에서 발생한 횟수는 독립이다.
b ) h길이의 충분히 짧은 하위 구간에 하나가 발생할 확률은 람다*h와 근사한다.
c ) 충분히 짧은 하위구간에서 2개 이상 발생할 확률은 본질적으로 zero이다.
포아송과 이항분포 비교
한 실험이 근사 포아송 과정의 세 가지 조건을 만족한다고 할 때, X는 길이1의 구간안에서 사건이 발생하는 숫자를 나타낸다. 음이 아닌 정수인 x에 대해서 P(X=x)의 근사치를 찾고자 한다. 이를 위해 같은 길이1/n을 길이n인 하위구간에서 부구간으로 나눈다. n이 충분히 크다면 우리는 단위 구간에서 사건이 x번 발생할 확률을 n개 부구간 중에서 정확히 x개 부구간에서 각각 사건이 하나씩 발생할 확률로 근사할 수 있다. 길이 1/n인 부구간에서 사건이 하나 발생할 확률은 조건 b)에 의해 근사적으로 람다*(1/n)이다. 모든 하위 구간에서 두 개 이상 발생할 확률은 본질적으로 제로다 ( c)에 의해서 ), 베르누이 시행으로써 각각의 하위구간에서 사건이 발생하거나 발생하지 않는 것을 생각해보면, a)조건에 의해, 확률p를 갖는 연속된 n번의 독립 베르누이 시행으로 근사적으로 람다&(1/n)과 같은 확률을 갖는다.
이항 확률에 의해 다음과 같이 주어진다.
포아송 분포의 pmf
포아송 분포의 mgf
Ex 2.7-3
컴퓨터 파일의 백업을 위해 USB flash drive가 종종 사용된다. 그러나 과거에는 신뢰성이 떨어지는 백업시스템으로 컴퓨터 테입이 사용됐다. 그리고 이러한 테잎에서는 결함이 발생했다. 특정 상황에서 중고 컴퓨터테잎의 결함은 평균적으로 1200피트당 한 개 꼴로 발생했다. 만약 포아송 분포를 가정하면 X의 분포는 무엇이고, 4800 Foot roll에서의 결함의 수는 얼마인가?
Ex 2.7-5
크리스마스 전구 생산업자는 제품 중 2%가 불량임을 알고 있다. 독립을 가정할 때, 100개의 전구 박스 안에서의 결함 전구의 수는 모수 n= 100, p = 0.02를 갖는 이항 분포를 갖는다. 확률 근사하기 위해서, 전구 100개 들어있는 박스에 최대 3개의 결함 전구가 포함되므로 우리는 람다 100*0.02를 갖는 포아송 분포를 사용할 수 있다. 이항 분포를 사용하면 약간의 복잡한 식을 거쳐 다음의 확률을 도출해 낼 수도 있다.
통계패키지와 통계계산기를 사용할 수 있기 때문에 이항분포로 확률 계산하는 것이 쉬웠졌다. 때문에 확률을 정확히 찾을 수 있다면 포아송 근사를 이용해 이항분포 확률을 계산할 필요가 없다.