1 분 소요

본 게시물은 통계의 본질님의 유튜브 강의를 보고 정리하는 글이다.

1. 확률 질량 함수 (PMF)

👀 확률 질량 함수란?

확률 질량 함수(probability mass function, PMF)는 이산 확률 변수의 분포를 나타며, 특정 값에 대한 확률을 나타내는 함수이다.

\[f_X(x) = Pr(X=x)\] \[Pr(X=x) = Pr({s \in S : X(s) = x})\]

위 수식을 순서대로 해석하면 다음과 같다. 1. 확률 질량 함수 $f_X(x)$는 이산 확률 변수 $X$가 $x$일 확률이고, 2. 이는 표본공간 $S$의 원소인 사건 $s$이 이산 확률 변수 $X$를 통해 매핑된 실수 $x$의 확률이다.

📍 확률 질량 함수 예시

$S$: 동전을 한번 던졌을 때 모든 결과의 표본 공간
$X$: $S$에 의해 정의되는 확률 변수

$S$의 원소인 사건 $s$는 앞면과 뒷면이며, 사건이 확률변수를 통해 매핑된 실수 $x$는 0과 1이다. 또한 앞면과 뒷면이 나올 확률은 모두 $1/2$로 동일하므로 확률 질량 함수 pmf는 다음과 같다.

\[f_X(x) = \begin{cases} 1/2 & x \in \{0,1\} \\\\ 0 & x \notin \{0,1\} \end{cases}\]

2. 확률 밀도 함수 (PDF)

👀 확률 밀도 함수란?

확률 밀도 함수(probability density function, PMF)는 연속 확률 변수의 분포를 나타며, 범위에 대한 확률을 나타내는 함수이다.

  • 확률 밀도 함수의 조건
\[모든 \,실수값\,x에 대해 f(x) \geq 0\\\] \[\int_{-\infty}^{\infty}f(x) = 1\]
  • 확률 밀도 함수와 누적 분포 함수의 관계
\[F(x) = \int_{-\infty}^{x}f(x)dx\] \[f(x)=\frac{d}{dx}F(x)\]

📍 확률 밀도 함수 예시

박테리아가 일반적으로 4시간에서 6시간을 산다고 가정해본다. 이때 박테리아가 정확히 5시간을 살고 죽을 가능성은 없으므로 이에대한 확률은 0과 같다. 그러나 막테리아가 5시간에서 5시간 10분 사이에 죽을 확률은 정량화 할 수 있다. 더 나아가 만약 이 확률이 2%라고 가정하면, 5시간에서 5시간 1분 사이에 죽을 확률은 0.2%라고 정량화 할 수 있다.

\[f(x) = \begin{cases} 1/12 & 0 < x < 12 \\\\ 0 & otherwise \end{cases}\]

댓글남기기