Continuous distribution (3) Gamma Distribution
여러 분포들에 대한 소개
1. Definition
사건이 서로 독립적일 때, 단위 시간 동안 발생하는 사건의 횟수가 포아송 분포를 따르고, 이 사건들이 일어나기 까지의 총 대기 시간을 모델링하는 확률 분포
- 확률변수 X: 어떤 사건이 여러 번($\alpha$) 발생하는 데 걸리는 시간
- 형상 매개변수 $\alpha$와 $\beta$가 주어져야 함
- $\alpha (k)$: 사건의 발생 횟수 (지수분포의 개수)
- $\beta (\theta)$: 단위 시간당 사건의 발생 횟수
👀 definition
If $X_1, …, X_{\alpha}$ are independent random variables each having an exponential distribution with parameter $\beta$, then the random variable $X = X_1 + … + X_{\beta}$ has a gamma distribution with parameter $\alpha$ and $\beta$.
- 감마분포는 지수분포의 합으로 나타낼 수 있음
- 사건들이 발생하는 데 걸리는 시간의 총 합
2. PDF
\[f(x; \alpha, \beta) = \frac {\beta^\alpha} {\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, \;\; \text{for }x>0\]- $\alpha (k)$: 사건의 발생 횟수 (지수분포의 개수)
- $\beta (\theta)$: 단위 시간당 사건의 발생 횟수
📍 감마함수
\[\Gamma(\alpha) = \int^\infty_0 x^{\alpha -1} e^{-x}dx \\ \Gamma(1) = \int^\infty_0 e^{-x} dx = 1 \\ \Gamma(\alpha) = (\alpha -1) \Gamma(\alpha -1) \\ \Gamma(\alpha +1) = \alpha \Gamma(\alpha)\]- 감마함수는 factorial을 식수 및 복소수로 확장한 것
📍 감마함수로부터 감마분포 유도
\[\Gamma(\alpha) = \int^\infty_0 x^{\alpha -1} e^{-x}dx \\\]- 위 식에서 확률변수 X=x라 할 때, 구간 0에서 $\infty$ 까지의 적분은 1이 되어야 함
- 양변을 $\Gamma(\alpha)$로 나눔
- CDF에서 $f(x)$만을 나타낸 것
3. Theta
\[X \sim \text{Gamma}(\alpha, \beta)\]- $\alpha (k)$: 사건의 발생 횟수 (지수분포의 개수), 형상 매개변수
- $\beta (\theta)$: 단위 시간당 사건의 발생 횟수, 척도 매개변수
4. Summary Statistics
- Expectation: $\frac {\alpha} {\lambda}$
- Variance: $\frac {\alpha} {\lambda^2}$
5. Visualization
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import gamma
# 형상 매개변수(alpha/k)와 척도 매개변수(beta/theta) 설정
alpha_values = [1, 2, 3, 5] # 형상 모수
beta_values = [1, 2, 3, 5] # 척도 모수 (여기서는 1/beta를 척도로 사용함)
x = np.linspace(0, 20, 1000) # x 축 값 범위 설정
# 베타(척도 모수) 고정, 알파(형상 모수) 변화 시각화
plt.figure(figsize=(14, 6))
beta_fixed = 1 # 베타 고정
for alpha in alpha_values:
y = gamma.pdf(x, a=alpha, scale=1/beta_fixed)
plt.plot(x, y, label=f'α (k)={alpha}, β (θ)={beta_fixed}')
plt.title(f'Gamma Distribution with β (θ) Fixed at {beta_fixed}')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()
# 알파(형상 모수) 고정, 베타(척도 모수) 변화 시각화
plt.figure(figsize=(14, 6))
alpha_fixed = 2 # 알파 고정
for beta in beta_values:
y = gamma.pdf(x, a=alpha_fixed, scale=1/beta)
plt.plot(x, y, label=f'α (k)={alpha_fixed}, β (θ)={beta}')
plt.title(f'Gamma Distribution with α (k) Fixed at {alpha_fixed}')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()
- 형상 모수가 클 수록 분포가 완만해짐
- 사건의 수가 증가함에 따라, 해당 사건들이 발생하는 데 필요한 총 시간의 분포가 넓어짐
- 사건들이 발생하는 데 걸리는 총 시간이 길어질 확률이 높아진다는 것을 의미
- 척도 모수가 클 수록 분포가 완만해짐
- 척도 모수가 크다 ☞ $\lambda$가 작다
- 단위 시간당 사건 발생 비율이 낮아짐을 의미하며, 결과적으로 사건이 발생하기까지의 시간이 길어질 확률이 높아짐
댓글남기기