PMF vs PDF
본 게시물은 통계의 본질님의 유튜브 강의를 보고 정리하는 글이다.
1. 확률 질량 함수 (PMF)
👀 확률 질량 함수란?
\[f_X(x) = Pr(X=x)\] \[Pr(X=x) = Pr({s \in S : X(s) = x})\]확률 질량 함수(probability mass function, PMF)는 이산 확률 변수의 분포를 나타며, 특정 값에 대한 확률을 나타내는 함수이다.
위 수식을 순서대로 해석하면 다음과 같다. 1. 확률 질량 함수 $f_X(x)$는 이산 확률 변수 $X$가 $x$일 확률이고, 2. 이는 표본공간 $S$의 원소인 사건 $s$이 이산 확률 변수 $X$를 통해 매핑된 실수 $x$의 확률이다.
📍 확률 질량 함수 예시
\[f_X(x) = \begin{cases} 1/2 & x \in \{0,1\} \\\\ 0 & x \notin \{0,1\} \end{cases}\]$S$: 동전을 한번 던졌을 때 모든 결과의 표본 공간
$X$: $S$에 의해 정의되는 확률 변수$S$의 원소인 사건 $s$는 앞면과 뒷면이며, 사건이 확률변수를 통해 매핑된 실수 $x$는 0과 1이다. 또한 앞면과 뒷면이 나올 확률은 모두 $1/2$로 동일하므로 확률 질량 함수 pmf는 다음과 같다.
2. 확률 밀도 함수 (PDF)
👀 확률 밀도 함수란?
확률 밀도 함수(probability density function, PMF)는 연속 확률 변수의 분포를 나타며, 범위에 대한 확률을 나타내는 함수이다.
- 확률 밀도 함수의 조건
- 확률 밀도 함수와 누적 분포 함수의 관계
📍 확률 밀도 함수 예시
\[f(x) = \begin{cases} 1/12 & 0 < x < 12 \\\\ 0 & otherwise \end{cases}\]박테리아가 일반적으로 4시간에서 6시간을 산다고 가정해본다. 이때 박테리아가 정확히 5시간을 살고 죽을 가능성은 없으므로 이에대한 확률은 0과 같다. 그러나 막테리아가 5시간에서 5시간 10분 사이에 죽을 확률은 정량화 할 수 있다. 더 나아가 만약 이 확률이 2%라고 가정하면, 5시간에서 5시간 1분 사이에 죽을 확률은 0.2%라고 정량화 할 수 있다.
댓글남기기