Notice
Recent Posts
Recent Comments
Link
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Archives
Today
Total
관리 메뉴

풀어쓰는 통계학

[수리통계] 결합확률분포와 주변확률분포 본문

수리통계

[수리통계] 결합확률분포와 주변확률분포

쿠달 2024. 3. 27. 14:35

1. 결합확률분포(Joint Probability Distribution)

결합확률분포는 두 개 이상의 확률변수가 동시에 특정한 값 또는 범위에 속할 확률을 나타내는 분포입니다. 즉, 두개 이상의 확률변수들의 교집합으로 다음과 같이 쓸 수 있습니다. 

 

$$
P(X, Y)=P(X \cap Y)
$$

 

이산형 확률변수의 결합확률질량함수(Joint Probability Mass Function)와 연속형 확률변수의 결합확률밀도함수(Joint Probability Density Function)는 확률변수들에 대한 결합확률을 나타내는 함수입니다. 이산형 확률변수의 경우 X 확률변수가 x값을 가지고 Y 확률변수가 y값을 동시에 가질 확률을 나타내고, 연속형 확률변수의 경우 점 확률에서 확률값을 가지지 않으므로 X와 Y 확률변수가 해당 구간에서 동시에 값을 지닐 확률을 나타냅니다. 

 

$$
f_{xy}(x, y)=P(X=x, Y=y)\text { (이산형) }
$$

$$
f _{xy}(x, y)=P\left(x_1<X<x_2, \quad y_1<Y<y_2\right) \\
=\int_{x_1}^{x_2} \int_{y_1}^{y_2} f(x, y) d y d x \text {(연속형)}\\
$$

 

2. 주변확률분포(Marginal Probability Distribution)

주확률분포는 결합분포에서 하나의 확률변수에 대한 확률분포를 추출하는 것을 말합니다. 결합분포는 X와 Y의 동시 확률을 나타내므로, 주변확률분포를 추출하기 위해서는 하나의 확률변수에 대한 확률분포를 독립적으로 분석해야 합니다. 이를 위해 결합확률분포에서 하나의 변수를 고정하고, 나머지 변수에 대한 가능한 모든 값들에 대한 확률을 합산하는 과정을 수행합니다.

 

1) 이산형 확률변수의 경우

$$
\begin{aligned}
&
f_X(x)=\sum_{y}^{} f(x, y) d y \\ 
&
f_Y(y)=\sum_{x}^{} f(x, y) d x \\
\end{aligned}
$$

모든 y값에 대한 결합확률분포 값을 더하면 X의 주변확률분포를 구할 수 있고,

모든 x값에 대한 결합확률분포 값을 더하면 Y의 주변확률분포를 구할 수 있습니다.

 

2) 연속형 확률변수의 경우

$$
\begin{aligned}
& f_X(x)=\int_{-\infty}^{\infty} f(x, y) d y \\
& f_Y(y)=\int_{-\infty}^{\infty} f(x, y) d x \\
\end{aligned}
$$

Y에 대해 적분을 취하면 X의 주변확률분포를 구할 수 있습니다.

X에 대해 적분을 취하면 Y의 주변확률분포를 구할 수 있습니다.

 

3. 독립확률변수(Independent Random Variables)

X와 Y가 독립이라면 결합확률밀도함수는 다음과 같이 표현됩니다. 

$$
f(x, y)=f_X(x) f_Y(y)
$$

 

두 변수가 독립이라는 것은 한 변수의 정보가 다른 한 변수의 값을 바꿀 수 없다(영향을 끼치지 않는다)는 것을 의미합니다.