본문으로 건너뛰기
실습하기

평균 절대 오차 (MAE)

이전 수업에서 다룬 평균 제곱 오차는 예측값과 실제 값 간의 차이를 제곱한 후 평균을 구하는 방식이었습니다.

MSE는 큰 오차에 민감하다는 특징이 있어, 이상치(Outlier)가 있는 데이터에서는 모델 평가에 적절하지 않을 수 있습니다.

이러한 문제를 보완하기 위해 MAE(Mean Absolute Error, 평균 절대 오차)가 사용됩니다.

MAE는 모델이 예측한 값과 실제 값 사이의 절대적인 차이를 평균 내는 방식으로 계산됩니다.


평균 절대 오차 계산 방법

MAE는 다음과 같은 공식으로 계산됩니다.

MAE=1ni=1nyiy^i\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|

여기서 각 항목은 다음과 같은 의미를 가집니다.

  • nn : 데이터 샘플의 개수

  • yiy_i : 실제 값(정답)

  • y^i\hat{y}_i : 모델이 예측한 값

평균 절대 오차는 각 데이터 샘플에서 모델이 예측한 값과 실제 값 간의 차이를 절대값으로 변환한 후, 전체 평균을 구합니다.

MAE 예시
실제 값: [10, 20, 30]
예측 값: [15, 25, 35]

MAE = (|10-15| + |20-25| + |30-35|) / 3
= (5 + 5 + 5) / 3
= 15 / 3
= 5

MAE는 어떻게 해석해야 할까요?

MAE는 모델이 예측한 값이 실제 값과 평균적으로 얼마나 차이가 나는지를 나타냅니다.

MAE 값이 작을수록 예측이 실제 값과 가까우며, 모델의 성능이 좋다고 볼 수 있습니다.

MSE와 달리 MAE는 오차를 제곱하지 않으므로 이상치에 덜 민감합니다.

따라서 이상치가 많은 데이터에서도 안정적인 평가 지표로 사용할 수 있습니다.


MAE는 어떤 한계가 있을까요?

1. 미분이 불가능한 지점이 존재함

MAE의 절대값 연산은 특정 지점에서 미분이 불가능하기 때문에, 경사 하강법(Gradient Descent)과 같은 최적화 알고리즘에서 다루기 어려울 수 있습니다.
이 문제를 해결하기 위해, 일부 모델에서는 MAE 대신 Huber Loss를 사용하기도 합니다.

2. 오차의 방향을 고려하지 않음

MAE는 단순히 오차의 크기만 평가할 뿐, 예측값이 실제 값보다 높거나 낮은지를 고려하지 않습니다.
따라서 모델의 편향(Bias)을 분석할 때는 MSE나 다른 지표와 함께 사용해야 합니다.


MAE는 MSE보다 직관적인 해석이 가능하고, 이상치에 덜 민감하기 때문에 다양한 회귀 문제에서 유용한 평가 지표로 사용됩니다.

다음 수업에서는 회귀 모델 평가에 자주 사용되는 또 다른 지표인 R² 결정 계수에 대해 알아보겠습니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!