티스토리 뷰
📌 왜 통계학에서는 절댓값보다 제곱을 쓸까?
– 퍼짐 측정에서 평균절대편차(L1)와 분산(L2)의 진짜 차이
1️⃣ 시작 – 평균만으로는 부족하다
시험을 보고 나면 선생님이 이렇게 말씀하시죠.
"이번 시험 평균은 75점입니다."
그런데 평균만 듣고 "다들 비슷하게 맞았겠네"라고 생각하면
사실은 전혀 다른 상황일 수도 있습니다.
학생 | 점수 |
---|---|
A | 75 |
B | 75 |
C | 75 |
D | 75 |
혹은 이렇게:
학생 | 점수 |
---|---|
A | 30 |
B | 50 |
C | 100 |
D | 120 |
평균은 똑같이 75점인데
점수의 퍼짐 정도는 전혀 다릅니다.
2️⃣ 퍼짐을 재는 두 가지 방법
이 퍼짐을 숫자로 표현하는 방법은 크게 두 가지가 있습니다.
- L1 방식 – 평균절대편차: 편차의 절댓값 평균
- L2 방식 – 분산: 편차를 제곱해서 평균
예시로 비교해볼게요.
점수 | 편차 | 절댓값 (L1) | 제곱 (L2) |
---|---|---|---|
80 | -10 | 10 | 100 |
85 | -5 | 5 | 25 |
95 | +5 | 5 | 25 |
100 | +10 | 10 | 100 |
평균절대편차 (L1): (10 + 5 + 5 + 10) ÷ 4 = 7.5
분산 (L2): (100 + 25 + 25 + 100) ÷ 4 = 62.5
3️⃣ 그런데 왜 통계학에서는 제곱(L2)만 쓸까?
직관적으로는 절댓값 평균(L1)이 더 쉬워 보입니다.
하지만 통계학에서는 항상 L2(분산)만 씁니다.
그 이유는 생각보다 단순한 "계산 편리" 때문이 아닙니다.
🚀 L1과 L2의 진짜 차이 – 수학적 구조
🎯 집단 합산 가능성의 차이
통계학에서는 여러 집단의 퍼짐을 비교하거나 합칠 일이 많습니다.
예를 들어:
- A반 분산: 10
- B반 분산: 20
특정 조건이 맞으면 전체 학생들의 분산은:
10 + 20 = 30
처럼 깔끔하게 합산할 수 있습니다.
왜 가능할까요?
✅ L2(분산)에서는 공식이 존재
제곱 연산은 덧셈 구조와 잘 어울립니다.
편차를 제곱해서 더하면
집단을 합쳤을 때 전체 퍼짐과 정확히 연결됩니다.
즉, 수학적으로 선형성이 유지됩니다.
이것이 가능하기 때문에 통계학에서는 분산(L2)을 사용합니다.
❗️ L1(평균절대편차)에서는 왜 불가능한가?
여기서 중요한 논리적 이유:
절댓값 연산은 비선형 연산입니다.
편차들의 절댓값 평균은
집단을 합치기 전에 평균낸 값과
집단을 합친 뒤 평균낸 값이 다릅니다.
절댓값은 연산 순서에 따라 값이 바뀌기 때문에
두 집단의 평균절대편차를 단순히 더하거나 평균내서
전체 퍼짐을 구할 수 없습니다.
이 구조적 한계 때문에
통계학에서는 평균절대편차(L1)를 퍼짐 측정 공식으로 사용하지 않습니다.
📌 최종 정리
구분 | L1 (평균절대편차) | L2 (분산) |
---|---|---|
연산 구조 | 비선형 (절댓값) | 선형 (제곱) |
이상치 영향 | 적음 (선형 증가) | 큼 (제곱으로 폭증) |
합산 가능성 | ❌ 불가능 | ✅ 가능 (분산 공식) |
원인 | 절댓값 → 연산 순서 따라 값 달라짐 | 제곱 → 덧셈 구조 유지 |
통계학 이론 연결 | 약함 | 강함 (정규분포, 중심극한정리 등) |
✅ 마무리
통계학에서 분산(L2 방식)을 선택한 이유는
단순히 계산이 편하거나 미분이 가능해서가 아닙니다.
퍼짐이라는 개념을 수학적으로 체계적으로 다루고,
여러 집단의 퍼짐을 비교하거나 합산할 수 있도록
구조를 만들기 위해 L2(제곱)를 선택한 것입니다.
'통계학 > 여인권-통계학의 이해' 카테고리의 다른 글
확률변수란? (0) | 2025.03.31 |
---|---|
Z점수 표준화가 평균0, 표준편차 1이 되는 이유 (0) | 2025.03.31 |
통계학이란 무엇인가? (0) | 2025.03.31 |
기대값이 확률 x 확률변수인 이유 (0) | 2025.01.24 |
평균이 중심위치인 이유 (0) | 2025.01.23 |
- Total
- Today
- Yesterday
- jlpt
- 일본어
- 코딩테스트
- 일본어문법무작정따라하기
- 오블완
- 인지부조화
- 회계
- 통계학
- K-MOOC
- 백준
- EBS
- 티스토리챌린지
- 열혈프로그래밍
- 일문따
- 보세사
- 심리학
- Python
- stl
- 류근관
- C/C++
- 뇌와행동의기초
- C
- 사회심리학
- 데이터분석
- 인프런
- 여인권
- 통계
- 파이썬
- 윤성우
- c++
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |