Continuous distribution (2) Exponential Distribution
여러 분포들에 대한 소개
1. Definition
사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 포아송 분포를 따른다면 다음 사건이 일어날 때 까지의 대기 시간 t의 확률분포
- 확률변수 X: 어떤 사건이 한 번 발생하는 데 걸리는 시간
- 기대값 $\lambda$가 주어져야 함
2. PDF
\[f(x; \lambda) = \begin{cases} \lambda e^{-\lambda x} \ (\text{where} x \geq 0) \\ 0 \;\;\;\;\;\;\;\; (\text{where} x \lt 0) \end{cases}\]- $\lambda$: 단위 시간 동안 발생하는 사건의 횟수 (=기대값)
3. Theta
\[X \sim \text{Exp}(\lambda)\]- $\lambda$: 단위 시간 동안 발생하는 사건의 횟수 (=기대값)
4. Summary Statistics
- Expectation: $\frac {1} {\lambda}$
- Variance: $\frac {1} {\lambda^2}$
5. Visualization
import numpy as np
import matplotlib.pyplot as plt
# 람다 값 설정
lambdas = [0.5, 1, 1.5, 2]
x = np.linspace(0, 3, 1000)
# 각 람다에 대한 PDF 계산 및 그래프 그리기
for lam in lambdas:
pdf = lam * np.exp(-lam * x)
plt.plot(x, pdf, label=f'λ = {lam}')
plt.title('Probability Density Function of Exponential Distributions')
plt.xlabel('x')
plt.ylabel('PDF')
plt.legend()
plt.show()
- lambda는 y축에 표시됨
- lambda가 클수록 기울기가 가파름 ☞ 사건이 빨리 발생할 확률이 높음
📍PDF & CDF
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import expon
lambda_param = 1.0
x = np.linspace(0, 10, 1000)
pdf = expon.pdf(x, scale=1/lambda_param)
cdf = expon.cdf(x, scale=1/lambda_param)
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.plot(x, pdf, 'r-', label=f'PDF (lambda={lambda_param})')
plt.title('Probability Density Function of Exponential Distribution')
plt.xlabel('x')
plt.ylabel('Density')
plt.legend()
plt.subplot(1, 2, 2)
plt.plot(x, cdf, 'b-', label=f'CDF (lambda={lambda_param})')
plt.title('Cumulative Distribution Function of Exponential Distribution')
plt.xlabel('x')
plt.ylabel('Probability')
plt.legend()
plt.tight_layout()
plt.show()
📍지수분포와 포아송분포의 관계
- Poisson Distribution: 단위 시간에서 평균 횟수가 $\lambda$일 때, 사건의 발생 횟수 x에 대한 분포
- 단위 시간을 t로 확장 ☞ 단위 시간에서 평균 $\lambda$이므로 t로 확장시 기대값은 $\lambda t$
✏️ x = 0 일 경우
\(f(0) = e^{-\lambda t}\)
- 단위 시간 t에서 사건이 일어나지 않을 확률
- 즉, 사건 발생까지의 대기시간이 단위 시간인 t보다 클 확률과 같음
✏️ 여사건 표현
\(1 - f(0) = 1 - e^{-\lambda t}\)
- 단위 시간 t 동안 사건이 1회라도 일어날 확률
- 즉, 사건 발생까지의 대기시간이 단위 시간인 t보다 작을 확률과 같음
- 이는 지수함수의 정의를 통해 CDF로 해석 될 수 있음
- PDF를 구하기 위해서 미분 수행
☀️ 정리
- 포아송 분포의 사건 발생 확률을 통해 CDF를 유도하였고, 이를 미분하여 지수함수의 PDF 도출
댓글남기기