본문으로 건너뛰기

하이퍼파라미터의 기본 개념

하이퍼파라미터란 무엇일까요?

하이퍼파라미터(Hyperparameters)는 AI 모델을 훈련시킬 때 설정하는 매개변수로, 모델의 학습 과정과 성능에 영향을 미칩니다. 모델의 구조를 정의하거나 학습 방법을 결정하는 데 사용되고 학습 전에 미리 설정합니다.

적절한 하이퍼파라미터 설정은 모델이 데이터를 더 잘 이해하고, 예측 정확도를 높입니다.

주요 하이퍼파라미터 종류

  1. 배치 크기 (Batch Size): 모델이 한 번에 처리하는 데이터의 수를 의미하며, 배치 크기는 메모리 사용량과 학습 안정성에 영향을 미칩니다.

  2. 학습률 (Learning Rate): 학습률은 모델이 학습하는 속도를 결정합니다. 적절한 학습률은 모델이 최적의 해를 빠르게 찾도록 도와줍니다.

  3. 에폭 수 (Number of Epochs): 전체 데이터셋을 몇 번 반복해서 학습할지 결정합니다. 적절한 에폭 수는 모델이 데이터를 충분히 학습할 수 있도록 도와줍니다.

  4. 정규화 파라미터 (Regularization Parameters): 모델이 과적합되는 것을 방지하기 위해 사용됩니다. 수업에서는 다루지 않기 때문에 간단히 넘어갑니다.

다음 수업에서는 각각의 파라미터를 자세히 알아보고 어떻게 설정해야 하는지 알아보겠습니다.

실습

오른쪽 실습 화면에서 하이퍼파라미터를 조절해보며 값을 변경하는 방법에 대해 알아봅니다.