모델의 예측 성능을 평가하는 재현율
머신러닝에서 분류 모델의 성능을 평가할 때 정밀도뿐만 아니라 재현율(Recall)
도 중요한 지표입니다.
재현율은 모델이 실제 양성 데이터를 얼마나 놓치지 않고 예측했는지를 나타냅니다.
재현율은 다음과 같이 계산합니다.
여기서 각 용어의 의미는 다음과 같습니다.
-
TP (True Positive)
: 실제 양성이고, 모델이 양성으로 예측한 경우 -
FN (False Negative)
: 실제 양성이지만, 모델이 음성으로 잘못 예측한 경우
쉽게 말해, 재현율은 머신러닝 모델이 실제 양성인 상황을 얼마나 정확하게 찾아냈는지를 의미합니다.
암 진단 모델에서 재현율이 높다면 실제 암 환자를 대부분 암으로 예측했다는 의미입니다.
재현율이 중요한 경우
재현율이 중요한 대표적인 사례는 다음과 같습니다.
1. 질병 진단 시스템 (암 진단 모델)
암 환자를 놓치는 것은 매우 치명적인 결과를 초래할 수 있습니다.
따라서 암 진단 모델에서는 정밀도보다 재현율을 더 중요하게 고려해야 합니다.
재현율이 낮으면 암 환자를 건강한 사람으로 잘못 예측할 가능성이 커집니다.
2. 재난 경보 시스템
화재 경보, 지진 경보 등의 시스템에서는 한 번이라도 위험을 놓치는 것이 치명적입니다.
따라서 거짓 경보(False Positive)가 늘어나더라도 재현율을 높이는 것이 중요합니다.
재현율의 한계
재현율이 높은 모델이 항상 좋은 것은 아닙니다.
재현율을 지나치게 높이면 반대로 정밀도(Precision)
가 낮아질 가능성이 큽니다.
예를 들어 금융 사기 탐지 모델에서 재현율을 높이기 위해 의심스러운 거래를 넓게 잡으면, 정상적인 거래도 사기 거래로 잘못 탐지될 수 있습니다.
따라서 모델 평가에서는 정밀도와 재현율을 함께 고려해야 합니다.
정밀도와 재현율 사이의 균형을 맞추기 위해 F1-Score
라는 종합적인 평가 지표를 사용하기도 합니다.
다음 수업에서는 F1-Score
에 대해 알아보겠습니다.
다음 내용이 궁금하다면?
코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!