[하버드 확률론 기초: Statistics 110] 4강- 조건부 확률 (Conditional Probability)
Dobby-HJ
·2023. 6. 29. 00:21
본 글은 아래의 강의 자료를 기반으로 작성된 것임을 밝힙니다.
https://www.boostcourse.org/ai152/joinLectures/195039
[[하버드] 확률론 기초: Statistics 110
부스트코스 무료 강의
www.boostcourse.org](https://www.boostcourse.org/ai152/joinLectures/195039)
Matching Problem
- $i$번째 뽑은 카드에 적힌 숫자가 $i$인 카드를 뽑을 확률
- if. K개가 모두 적힌 숫자가 $i$인 경우
- $P(A_1\cap A_2\cap \dots \cap A_k) = \cfrac{(n-k)!}{n!}$
- 이렇게 설명되는 이유는 $k$개 까지의 모든 카드의 번호가 정해져 있고, 나머지는 순서가 상관없기 때문.
- $P(\text{no-match}) = P(\bigcap_{j=1}^{\infty}A_j^c) = 1 - P(\bigcup_{j=1}^{\infty}A_j)$
이때 $P(\bigcup_{j=1}^{\infty}A_j)$은 위에서 구한 $P(A_1 \cap A_2 \dots \cap A_k) = \cfrac{(n-k)!}{n!}$를 이용해 다음과 같이 계산할 수 있다. - $\sum_{j=1}^\infty P(A_j) - \sum_{j=1, k = 1}^\infty P(A_j \cap A_k ) + \dots$ 대충 이런식으로 표현 가능한데, 이때 각 항의 갯수가 \binom{n}{k}이므로 이것까지 곱하게 되면 $\cfrac{(n-k)!}{n!} \cfrac{n!}{(n-k)!k!}$이와 같이 나오게 되고, 각 항들은 모두 $\cfrac{1}{k!}$만 남게되어 $\sum_{j=1}^{\infty}(-1)^{n+1}k!$의 형태로 구현된다.
- 이거를 이제 계산해야하는데, 테일러 급수의 형태로 나오게 되고, 급수의 x값에 -1을 넣으면 정확히 일치하는 형태라 $\cfrac{1}{e}$가 나오게 된다.
- $P(A_1\cap A_2\cap \dots \cap A_k) = \cfrac{(n-k)!}{n!}$
※테일러 급수는 다음과 같은 형태를 가진다. 여기의 x에 -1을 넣으면 위의 식과 동일하게 나온다.
$$e^x = \sum_{n=0}^\infty \cfrac{x^n}{n!} = 1 + x + \cfrac{x^2}{2!} + \cfrac{x^3}{3!} + \dots$$
Define Events A, B are independent
→ $P(A\cap B) = \varnothing$, $P(A\cap B) = P(A) P(B)$ 직관적으로는 이렇게 2개의 상황이 “독립”이다라고 떠오르지만, 실제로 “독립”이라고 말하는 것은 말 그대로 사건이 다른 사건이 일어나는데 도움을 주지 않는 것을 의미하는 사건 간 의 관계성입니다.
- $P(A\cap B) = \varnothing$
- 그냥 둘 사이의 교집합이 없는 상태
- disjoint : 배반 관계
- 배반은 A 사건이 일어난다면 B는 일어날 수 없음
- independent : 독립 관계
- 독립은 A사건이 일어난 것을 B는 모름.
- 만약 A, B, C가 모두 independent라면
- $P(A,B) = P(A\cap B) = P(A \text{ and B}) = P(A)P(B)$ 독립일 경우 앞의 표현들도 모두 같은 표현
- $A, B,C$가 독립임을 말하려면 다음의 조건식이 만족해야 한다.
$$P(A, B) = P(A)P(B), \ P(A,C) = P(A)P(C), \ P(B, C) = P(B)P(C), \ P(A, B,C) = P(A)P(B)P(C)$$- 마지막 식도 만족해야 하기 때문에 이를 다음과 같이 표현한다
- “쌍”으로 독립(pairwise independence)과
- “전체” 독립을 모두 확인해야 원소들의 독립을 확인할 수 있다.
- 마지막 식도 만족해야 하기 때문에 이를 다음과 같이 표현한다
- “독립”이라고 하면 교사건(intersection)의 확률을 구할 때 곱하는 것을 의미합니다.
Newton-Pepys Problem
- 6개의 주사위 중에서 적어도 한 개가 ‘6’이 나온 경우
- 12개의 주사위 중에서 적어도 두 개가 ‘6’이 나온 경우
- 18개의 주사위 중에서 적어도 세 개가 ‘6’이 나온 경우
다음 중에서 가장 확률이 높은 것은? 1번
- 증명
- $P(A) = 1 - (\cfrac{5}{6})^6 \approx 0.665$
- $P(B) = 1 - (\cfrac{5}{6})^12 - \binom{12}{1}(\cfrac{1}{6})(\cfrac{5}{6})^{11} \approx 0.619$
- $P(C) = 1 - \sum_{k=0}^2 \binom{18}{k}(\cfrac{1}{6})^k(\cfrac{5}{6})^{18-k}\approx 0.597$
- 첨언하자면, 뉴턴은 위와 같이 계산을 정확히 했지만 독립에 대한 직관은 틀리게 생각했는데요.
뉴턴은 주사위의 모든 눈이 나오는 확률을 동일하지 않다고 하더라도, A의 확률이 가장 높게 나올 것이라고 생각했습니다. 하지만 수식을 이해했다면, 잘못된 주사위를 만들게 된다면, 수식이 변동할 수 있음을 알 수 있습니다. - 스티븐 스티글러라고 하는 다른 통계학자가 아름다운 주장을 펼치며 뉴턴의 직관을 이해할 순 없어도, 틀릴 수 밖에 없다는 것을 보였습니다.