티스토리 뷰

반응형

F1 스코어는 왜 조화평균을 쓸까?

— 두 지표가 모두 ‘기여 단위가 역수 구조일 때’ 최적의 결합 방식이기 때문입니다.


1️⃣ 우선 구조부터 짚고 갑시다: Precision vs Recall

  • Precision (정밀도):
    내가 ‘정답’이라고 판단한 것 중 실제 정답인 비율Precision=TPTP + FP\text{Precision} = \frac{\text{TP}}{\text{TP + FP}}
  • Recall (재현율):
    실제 정답 중에서 내가 정답이라고 맞춘 비율Recall=TPTP + FN\text{Recall} = \frac{\text{TP}}{\text{TP + FN}}

둘은 다른 차원의 정확도입니다.

  • Precision은 내가 한 선택의 질
  • Recall은 전체 중에서 내가 잘 포착했는지의 정도

즉, 두 지표는 서로 동시에 최대화되기 어렵고, 서로 긴장 관계에 있어요.


2️⃣ 두 값을 '통합'하려면 어떤 원칙이 필요할까?

일반적으로 우리가 두 값을 하나로 합칠 때는 다음 원칙 중 하나를 따릅니다:

평균 종류 수식 의미

산술평균 x+y2\frac{x + y}{2} 단순 합산
기하평균 xy\sqrt{xy} 비율 기반 변화, 곱셈적 관계
조화평균 21x+1y\frac{2}{\frac{1}{x} + \frac{1}{y}} 균형적 통합, 작은 값에 민감

❗ 그런데 여기서 우리가 원하는 건 이런 통합입니다:

  • 두 값 중 하나라도 작으면 전체 성능이 나빠지는 구조
  • 둘 다 크지 않으면 의미 없는 성능
  • Precision이 1이고 Recall이 0이면? → 전체 성능도 0이어야 한다

이런 상황에서는 산술평균은 적절하지 않습니다.

1+02=0.5\frac{1 + 0}{2} = 0.5

정말 좋지 않은 모델인데도, 성능이 0.5로 나와요.


3️⃣ 조화평균은 왜 정답이 되는가?

조화평균은 다음 원칙을 따릅니다:

조화평균(x,y)=2xyx+y\text{조화평균}(x, y) = \frac{2xy}{x + y}

이 함수는 다음 특성을 가집니다:

  • x나 y 중 하나라도 0이면 전체 평균이 0
  • 작은 값이 전체 평균을 더 크게 깎아내림 → 작은 값이 결정적인 역할
  • 두 값이 같을수록 평균이 그 값에 가까워짐
  • 즉, 균형이 가장 중요하고, 불균형은 곧 성능 저하로 표현됨

👉 이게 바로 F1 Score가 나타내려는 철학

정밀도와 재현율이 둘 다 높아야 모델이 진짜 잘 작동하는 것
→ 어느 하나라도 낮으면 의미가 없고,
→ 둘 사이의 균형이 가장 중요하다

이 원리를 만족시키는 유일한 평균이 조화평균입니다.


4️⃣ 수학적 의미: “동시적 기여”의 평균

조화평균은 다음 같은 철학적 사고에서 나옵니다:

“전체 결과는, 각 요소가 동시에 기여하는 구조로 나타난다.”

이 구조는 병렬 저항과 비슷합니다.

  • 전기 회로에서 두 저항이 병렬로 연결되면, 전체 저항은 다음과 같이 계산합니다:1Rtotal=1R1+1R2\frac{1}{R_{\text{total}}} = \frac{1}{R_1} + \frac{1}{R_2}→ 이걸 다시 풀면:Rtotal=R1R2R1+R2R_{\text{total}} = \frac{R_1 R_2}{R_1 + R_2}= 조화평균의 구조

즉, 병렬 구조에서는 가장 약한 저항 하나가 전체에 큰 영향을 미칩니다
→ 이것은 작은 값이 전체를 결정하는 조화평균의 특성과 같습니다.


5️⃣ 이걸 다시 F1으로 보면

F1=2⋅Precision⋅RecallPrecision + RecallF_1 = \frac{2 \cdot \text{Precision} \cdot \text{Recall}}{\text{Precision + Recall}}

이 구조는 정확도와 포착률이라는 두 가지 병렬 성능을 조화롭게 반영합니다.
그리고 작은 값 하나가 전체 성능을 떨어뜨리는 구조를 갖습니다.

🎯 이건 다음과 같은 상황에 딱 맞습니다:

  • "우리는 잘 맞춘 것도 중요하지만, 놓친 것도 중요하다"
  • "하나라도 못하면 전체는 무의미하다"
  • "균형이 중요하다"

🔚 결론: 조화평균은 왜 F1에 쓰이는가?

  1. Precision과 Recall은 동시에 중요하며,
    둘 중 하나라도 낮으면 전체 성능도 낮아야 합니다.
  2. 조화평균은 그런 구조를 정확히 반영하는 유일한 평균 방식입니다.
    작은 값에 민감하고, 균형이 중요하다는 원칙을 수학적으로 표현합니다.
  3. 철학적으로, F1은 **‘성능은 두 능력의 동시 작용으로 구성된다’**는 생각에 기반하며,
    조화평균은 이런 ‘동시 기여의 구조’를 수학적으로 반영하는 방식입니다.

 

반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함
반응형