티스토리 뷰

반응형

 

🔷 베르누이 시행: 기댓값, 분산, 그리고 모수란?

 


 

✅ 1. 왜 결과를 숫자로 바꾸는가 — 확률변수의 존재 이유

확률변수는 어떤 사건이 일어났는지를 숫자로 표현하는 도구이다. 이 표현 덕분에 우리는 사건의 발생을 수학적으로 분석하고 예측할 수 있다.

예시: 동전 던지기 → 앞면: 1 / 뒷면: 0, 시험 합격 여부, 클릭 여부 등

말로 표현된 사건은 계산이 불가능하지만 숫자로 바꾸면 평균과 분산을 계산할 수 있게 된다.

확률변수 X는 1일 때 사건 발생, 0일 때 미발생을 뜻하며, 모든 통계의 출발점이 된다.

 


 

✅ 2. 기댓값의 직관: 평균이 아니라 반복의 구조

기댓값은 단 한 번의 예측값이 아니라, 수천 번의 반복 시행에서 평균적으로 수렴하는 중심값이다.

예시: 퀴즈 맞힐 확률이 0.8인 학생 100명 → 대략 80명이 정답. → 평균 = 0.8

기댓값은 예언이 아니라 반복 결과가 수렴하는 지점을 수치화한 것이다.

 


 

 

 

✅ 3. 왜 E[X]=XP(X) 이 정의인가

기댓값은 각 결과 X가 전체 평균에 기여하는 정도를 확률 P(X)만큼 가중하여 모두 더한 것이다.

X P(X)
1 0.2
2 0.5
5 0.3

 

예상 평균: E[X]=10.2+20.5+50.3=2.0

기댓값은 모든 결과의 확률 가중 평균이며, 반복 시행을 거칠수록 이 수치에 수렴한다.

 


 

✅ 4. 그래서 베르누이 분포에선 왜 E[X]=p 가 되는가

베르누이 분포는 오직 두 결과 0, 1만 갖는다.

X P(X)
0 1p
1 p

 

기댓값 계산:

E[X]=0(1p)+1p=p

0은 평균에 영향을 주지 않고, 1은 확률 p만큼 기여하기 때문에 기댓값은 p가 된다.

 


 

✅ 5. 베르누이 시행의 분산이 Var(X)=p(1p) 이 되는 이유

공식: Var(X)=E[X2](E[X])2

베르누이에서는 X2=X, 따라서 Var(X)=pp2=p(1p)

X P(X)
0 1p
1 p

 

 

직관적 계산:

Var(X)=(0p)2(1p)+(1p)2p=p(1p)

p가 0.5일 때 분산이 최대, p가 0 또는 1에 가까우면 분산이 0에 가까워짐.

2025.04.19 - [통계학/통계이론] - 분산 공식 증명 E(X^2) - E(X)^2

 

분산 공식 증명 E(X^2) - E(X)^2

✅ 분산의 정의분산이란 확률변수 X의 기댓값으로부터 얼마나 퍼져 있는가를 나타내는 수치로, 다음과 같이 정의됩니다.Var(X)=E[(XE[X])2] ✅ 정의를 전개위의 정의를 수학

eunjin123123.tistory.com

 


 

✅ 6. p는 왜 중요한가 — 모수(parameter)의 의미

p는 베르누이 분포를 완전히 결정짓는 하나의 값이다.

p가 클수록 성공이 확실, 작을수록 실패가 확실, p = 0.5일 땐 예측 불가능

p 하나로 다음이 모두 결정됨:

  • E[X]=p
  • Var(X)=p(1p)

 


 

✅ 7. 정리: 계산보다 구조를 보라

베르누이 분포는 단순하지만, 확률적 구조와 통계의 근간을 형성한다.

E[X]=p, Var(X)=p(1p)는 계산이 아니라 구조의 귀결이다.

이 구조는 이후 이항 분포, 로지스틱 회귀, MLE, 신뢰도 분석 등 모든 분야로 확장된다.

반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함
반응형