티스토리 뷰
F1 스코어는 왜 조화평균을 쓸까?
— 두 지표가 모두 ‘기여 단위가 역수 구조일 때’ 최적의 결합 방식이기 때문입니다.
1️⃣ 우선 구조부터 짚고 갑시다: Precision vs Recall
- Precision (정밀도):
내가 ‘정답’이라고 판단한 것 중 실제 정답인 비율Precision=TPTP + FP\text{Precision} = \frac{\text{TP}}{\text{TP + FP}} - Recall (재현율):
실제 정답 중에서 내가 정답이라고 맞춘 비율Recall=TPTP + FN\text{Recall} = \frac{\text{TP}}{\text{TP + FN}}
둘은 다른 차원의 정확도입니다.
- Precision은 내가 한 선택의 질
- Recall은 전체 중에서 내가 잘 포착했는지의 정도
즉, 두 지표는 서로 동시에 최대화되기 어렵고, 서로 긴장 관계에 있어요.
2️⃣ 두 값을 '통합'하려면 어떤 원칙이 필요할까?
일반적으로 우리가 두 값을 하나로 합칠 때는 다음 원칙 중 하나를 따릅니다:
평균 종류 수식 의미
산술평균 | x+y2\frac{x + y}{2} | 단순 합산 |
기하평균 | xy\sqrt{xy} | 비율 기반 변화, 곱셈적 관계 |
조화평균 | 21x+1y\frac{2}{\frac{1}{x} + \frac{1}{y}} | 균형적 통합, 작은 값에 민감 |
❗ 그런데 여기서 우리가 원하는 건 이런 통합입니다:
- 두 값 중 하나라도 작으면 전체 성능이 나빠지는 구조
- 둘 다 크지 않으면 의미 없는 성능
- Precision이 1이고 Recall이 0이면? → 전체 성능도 0이어야 한다
이런 상황에서는 산술평균은 적절하지 않습니다.
1+02=0.5\frac{1 + 0}{2} = 0.5
정말 좋지 않은 모델인데도, 성능이 0.5로 나와요.
3️⃣ 조화평균은 왜 정답이 되는가?
조화평균은 다음 원칙을 따릅니다:
조화평균(x,y)=2xyx+y\text{조화평균}(x, y) = \frac{2xy}{x + y}
이 함수는 다음 특성을 가집니다:
- x나 y 중 하나라도 0이면 전체 평균이 0
- 작은 값이 전체 평균을 더 크게 깎아내림 → 작은 값이 결정적인 역할
- 두 값이 같을수록 평균이 그 값에 가까워짐
- 즉, 균형이 가장 중요하고, 불균형은 곧 성능 저하로 표현됨
👉 이게 바로 F1 Score가 나타내려는 철학
정밀도와 재현율이 둘 다 높아야 모델이 진짜 잘 작동하는 것
→ 어느 하나라도 낮으면 의미가 없고,
→ 둘 사이의 균형이 가장 중요하다
이 원리를 만족시키는 유일한 평균이 조화평균입니다.
4️⃣ 수학적 의미: “동시적 기여”의 평균
조화평균은 다음 같은 철학적 사고에서 나옵니다:
“전체 결과는, 각 요소가 동시에 기여하는 구조로 나타난다.”
이 구조는 병렬 저항과 비슷합니다.
- 전기 회로에서 두 저항이 병렬로 연결되면, 전체 저항은 다음과 같이 계산합니다:1Rtotal=1R1+1R2\frac{1}{R_{\text{total}}} = \frac{1}{R_1} + \frac{1}{R_2}→ 이걸 다시 풀면:Rtotal=R1R2R1+R2R_{\text{total}} = \frac{R_1 R_2}{R_1 + R_2}= 조화평균의 구조
즉, 병렬 구조에서는 가장 약한 저항 하나가 전체에 큰 영향을 미칩니다
→ 이것은 작은 값이 전체를 결정하는 조화평균의 특성과 같습니다.
5️⃣ 이걸 다시 F1으로 보면
F1=2⋅Precision⋅RecallPrecision + RecallF_1 = \frac{2 \cdot \text{Precision} \cdot \text{Recall}}{\text{Precision + Recall}}
이 구조는 정확도와 포착률이라는 두 가지 병렬 성능을 조화롭게 반영합니다.
그리고 작은 값 하나가 전체 성능을 떨어뜨리는 구조를 갖습니다.
🎯 이건 다음과 같은 상황에 딱 맞습니다:
- "우리는 잘 맞춘 것도 중요하지만, 놓친 것도 중요하다"
- "하나라도 못하면 전체는 무의미하다"
- "균형이 중요하다"
🔚 결론: 조화평균은 왜 F1에 쓰이는가?
- Precision과 Recall은 동시에 중요하며,
둘 중 하나라도 낮으면 전체 성능도 낮아야 합니다. - 조화평균은 그런 구조를 정확히 반영하는 유일한 평균 방식입니다.
작은 값에 민감하고, 균형이 중요하다는 원칙을 수학적으로 표현합니다. - 철학적으로, F1은 **‘성능은 두 능력의 동시 작용으로 구성된다’**는 생각에 기반하며,
조화평균은 이런 ‘동시 기여의 구조’를 수학적으로 반영하는 방식입니다.
'머신러닝 > 머신러닝' 카테고리의 다른 글
머신러닝 평가지표, 정답률(Accuracy), Precision, Recall, F1 Score (0) | 2025.04.07 |
---|
- Total
- Today
- Yesterday
- 인프런
- 통계
- 오블완
- 여인권
- C/C++
- 회계
- 데이터분석
- 티스토리챌린지
- 통계학
- jlpt
- C
- 인지부조화
- 사회심리학
- 류근관
- 일문따
- 파이썬
- stl
- 일본어
- EBS
- c++
- 코딩테스트
- Python
- 윤성우
- 심리학
- 보세사
- 열혈프로그래밍
- K-MOOC
- 백준
- 뇌와행동의기초
- 일본어문법무작정따라하기
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |