티스토리 뷰
✨ Z 표준화 공식: 평균 0, 표준편차 1의 마법 풀기 ✨
안녕하세요, 데이터 마니아 여러분! 🎉
오늘은 통계의 숨은 보석, Z 표준화 (Z-score standardization)에 대해 파헤쳐볼게요.
특히 “왜 평균이 0이고 표준편차가 1이 되는 걸까?”라는 미스터리를 수학적으로 풀며 화려하게 증명해보려고 합니다.
준비되셨죠? Let’s dive in! 🚀
🌟 Z 표준화 공식: 이게 대체 뭐야?
Z 표준화는 데이터를 표준 정규 분포라는 멋진 세계로 초대하는 공식이랍니다.
공식은 심플하지만 강력해요:
$$ z = \frac{x - \mu}{\sigma} $$
- x: 원래 데이터 값
- μ (뮤): 데이터의 평균
- σ (시그마): 데이터의 표준편차
- z: 표준화된 값, 즉 Z-score
쉽게 말해, 데이터가 평균에서 얼마나 떨어져 있는지를 표준편차 단위로 쟀다고 생각하면 돼요.
예를 들어:
- z = 2 → 평균보다 2 표준편차 위
- z = -1 → 평균보다 1 표준편차 아래
멋지지 않나요? 🌈
🎯 평균이 0이 되는 비밀
Z 표준화를 하면 결과 데이터의 평균이 0이 된다고 해요.
왜일까요? 수학으로 깔끔하게 증명해볼게요!
z 값들의 평균은 이렇게 구해요:
$$ \text{평균}(z) = \frac{1}{n} \sum z_i = \frac{1}{n} \sum \frac{x_i - \mu}{\sigma} $$
σ는 상수니까 밖으로 빼면:
$$ \text{평균}(z) = \frac{1}{\sigma} \cdot \frac{1}{n} \sum (x_i - \mu) $$
여기서 합을 풀어보면:
$$ \sum (x_i - \mu) = \sum x_i - \sum \mu $$
평균의 정의에 따라, ∑xᵢ = nμ 이므로:
$$ \sum (x_i - \mu) = n \mu - n \mu = 0 $$
결국:
$$ \text{평균}(z) = \frac{1}{\sigma} \cdot \frac{0}{n} = 0 $$
짜잔! 🎉
평균이 0이 되는 마법, 증명 완료!
데이터에서 평균을 빼버리니 0으로 딱 떨어지네요.
🔥 표준편차가 1이 되는 이유
이제 표준편차가 1이 되는 이유를 알아볼 차례예요.
표준편차는 분산의 제곱근이니까, 먼저 z의 분산을 구해봅시다.
$$ \text{분산}(z) = \frac{1}{n} \sum (z_i - \text{평균}(z))^2 $$
평균이 0이므로:
$$ \text{분산}(z) = \frac{1}{n} \sum z_i^2 $$
z 값의 정의를 대입하면:
$$ z_i^2 = \frac{(x_i - \mu)^2}{\sigma^2} $$
따라서:
$$ \text{분산}(z) = \frac{1}{n} \sum \frac{(x_i - \mu)^2}{\sigma^2} = \frac{1}{\sigma^2} \cdot \frac{1}{n} \sum (x_i - \mu)^2 $$
여기서 \( \frac{1}{n} \sum (x_i - \mu)^2 \)는 원래 데이터의 분산, 즉 \( \sigma^2 \)입니다.
$$ \text{분산}(z) = \frac{\sigma^2}{\sigma^2} = 1 $$
분산이 1이므로 표준편차는:
$$ \text{표준편차}(z) = \sqrt{1} = 1 $$
Boom! 💥
표준편차 1, 완벽하게 증명됐어요!
표준편차로 나눠서 단위를 1로 맞춘 결과랍니다.
🌈 한눈에 보는 핵심 포인트
구분 | 의미 |
---|---|
평균 0 | 데이터를 평균(μ)만큼 이동시켜 0으로! |
표준편차 1 | 표준편차(σ)로 나눠 단위를 1로 통일! |
Z 표준화는 데이터를 평균 0, 표준편차 1인 표준 정규 분포로 변신시키는 마법이에요.
통계나 머신러닝에서 데이터 비교할 때 정말 유용하죠! ✨
🎉 마무리: 통계의 매력에 빠져보세요!
어때요, Z 표준화의 비밀 풀어보니 재밌죠?
겉보기엔 복잡해 보여도 결국 데이터를 깔끔하게 정리하는 과정일 뿐이에요.
궁금한 점 있으면 댓글로 물어보세요!
다음엔 더 신나는 통계 이야기로 돌아올게요.
See you soon! 👋
'통계학 > 여인권-통계학의 이해' 카테고리의 다른 글
베르누이 시행과 분포 (0) | 2025.04.19 |
---|---|
확률변수란? (0) | 2025.03.31 |
왜 통계학에서는 절댓값보다 제곱을 쓸까 (0) | 2025.03.31 |
통계학이란 무엇인가? (0) | 2025.03.31 |
기대값이 확률 x 확률변수인 이유 (0) | 2025.01.24 |
- Total
- Today
- Yesterday
- 인프런
- 여인권
- 강화학습
- 회계
- 일본어문법무작정따라하기
- Python
- 윤성우
- 류근관
- 인지부조화
- 열혈프로그래밍
- 뇌와행동의기초
- 통계학
- 데이터분석
- stl
- 티스토리챌린지
- 파이썬
- 통계
- K-MOOC
- 백준
- 보세사
- 심리학
- c++
- 정보처리기사
- 일문따
- 코딩테스트
- 사회심리학
- C/C++
- C
- 오블완
- 일본어
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |