티스토리 뷰

반응형

📌 왜 통계학에서는 절댓값보다 제곱을 쓸까?

– 퍼짐 측정에서 평균절대편차(L1)와 분산(L2)의 진짜 차이


1️⃣ 시작 – 평균만으로는 부족하다

시험을 보고 나면 선생님이 이렇게 말씀하시죠.

"이번 시험 평균은 75점입니다."

그런데 평균만 듣고 "다들 비슷하게 맞았겠네"라고 생각하면
사실은 전혀 다른 상황일 수도 있습니다.

학생점수
A75
B75
C75
D75

혹은 이렇게:

학생점수
A30
B50
C100
D120

평균은 똑같이 75점인데
점수의 퍼짐 정도는 전혀 다릅니다.


2️⃣ 퍼짐을 재는 두 가지 방법

이 퍼짐을 숫자로 표현하는 방법은 크게 두 가지가 있습니다.

  • L1 방식 – 평균절대편차: 편차의 절댓값 평균
  • L2 방식 – 분산: 편차를 제곱해서 평균

예시로 비교해볼게요.

점수편차절댓값 (L1)제곱 (L2)
80-1010100
85-5525
95+5525
100+1010100

평균절대편차 (L1): (10 + 5 + 5 + 10) ÷ 4 = 7.5

분산 (L2): (100 + 25 + 25 + 100) ÷ 4 = 62.5


3️⃣ 그런데 왜 통계학에서는 제곱(L2)만 쓸까?

직관적으로는 절댓값 평균(L1)이 더 쉬워 보입니다.
하지만 통계학에서는 항상 L2(분산)만 씁니다.

그 이유는 생각보다 단순한 "계산 편리" 때문이 아닙니다.


🚀 L1과 L2의 진짜 차이 – 수학적 구조

🎯 집단 합산 가능성의 차이

통계학에서는 여러 집단의 퍼짐을 비교하거나 합칠 일이 많습니다.

예를 들어:

  • A반 분산: 10
  • B반 분산: 20

특정 조건이 맞으면 전체 학생들의 분산은:

10 + 20 = 30

처럼 깔끔하게 합산할 수 있습니다.
왜 가능할까요?

✅ L2(분산)에서는 공식이 존재

제곱 연산은 덧셈 구조와 잘 어울립니다.

편차를 제곱해서 더하면
집단을 합쳤을 때 전체 퍼짐과 정확히 연결됩니다.

즉, 수학적으로 선형성이 유지됩니다.
이것이 가능하기 때문에 통계학에서는 분산(L2)을 사용합니다.

❗️ L1(평균절대편차)에서는 왜 불가능한가?

여기서 중요한 논리적 이유:

절댓값 연산은 비선형 연산입니다.
편차들의 절댓값 평균은
집단을 합치기 전에 평균낸 값과
집단을 합친 뒤 평균낸 값이 다릅니다.

절댓값은 연산 순서에 따라 값이 바뀌기 때문에
두 집단의 평균절대편차를 단순히 더하거나 평균내서
전체 퍼짐을 구할 수 없습니다.

이 구조적 한계 때문에
통계학에서는 평균절대편차(L1)를 퍼짐 측정 공식으로 사용하지 않습니다.


📌 최종 정리

구분 L1 (평균절대편차) L2 (분산)
연산 구조 비선형 (절댓값) 선형 (제곱)
이상치 영향 적음 (선형 증가) 큼 (제곱으로 폭증)
합산 가능성 ❌ 불가능 ✅ 가능 (분산 공식)
원인 절댓값 → 연산 순서 따라 값 달라짐 제곱 → 덧셈 구조 유지
통계학 이론 연결 약함 강함 (정규분포, 중심극한정리 등)

✅ 마무리

통계학에서 분산(L2 방식)을 선택한 이유는
단순히 계산이 편하거나 미분이 가능해서가 아닙니다.

퍼짐이라는 개념을 수학적으로 체계적으로 다루고,
여러 집단의 퍼짐을 비교하거나 합산할 수 있도록
구조를 만들기 위해 L2(제곱)를 선택한 것
입니다.

반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함
반응형