본문으로 건너뛰기
실습하기

정답과 함께 알려주는 지도 학습

AI를 학습시키는 방법은 크게 세 가지로 나뉩니다.

  • 지도 학습(Supervised Learning) : 정답이 포함된 데이터를 이용해 학습

  • 비지도 학습(Unsupervised Learning) : 정답이 없는 데이터를 이용해 학습

  • 강화 학습(Reinforcement Learning) : 정답에 대한 보상을 통해 학습

그중에서도 AI에게 정답(Label)이 포함된 데이터를 제공하면서 패턴을 학습시키는 지도 학습은 가장 널리 사용되는 인공지능 학습 방식입니다.


지도 학습이 진행되는 방식

쉽게 말해, 지도 학습은 학생이 문제를 풀 때 선생님이 정답을 알려주면서 학습하는 방식과 비슷합니다.

예를 들어, 고양이와 개 사진을 분류하는 AI 모델을 만들고 싶다고 가정해 보겠습니다.

지도 학습에서는 다음과 같은 입력(Input)정답(Label)을 포함한 데이터를 AI에게 제공합니다.

입력 (이미지)정답 (Label)
🐶 개 사진 1Dog
🐱 고양이 사진 1Cat
🐶 개 사진 2Dog
🐱 고양이 사진 2Cat

여기서 개, 고양이와 같이 분류되는 것을 클래스(Class)라고 합니다.

AI 모델은 이런 데이터를 학습하면서 각 클래스의 특징을 익히고, 새로운 사진을 받았을 때 어떤 동물인지 예측할 수 있도록 학습합니다.


지도 학습의 대표적인 유형

지도 학습은 크게 두 가지 유형으로 나뉩니다.


1. 분류(Classification)

입력 데이터를 여러 개의 카테고리(클래스) 중 하나로 분류하는 학습 방식입니다.

예를 들어 다음과 같은 분류 모델을 만들 수 있습니다.

  • 이메일 스팸 필터: 이메일이 "스팸"인지 "일반"인지 분류

  • 의료 진단 AI: 환자의 증상 데이터를 기반으로 특정 질병 여부를 예측

  • 고객 리뷰 감정 분석: 리뷰가 "긍정적"인지 "부정적"인지 판단


2. 회귀(Regression)

회귀는 키, 온도, 가격과 같이 연속적인 숫자 값 사이의 관계를 학습하는 방식입니다.

회귀 모델은 특정 입력이 주어졌을 때 그에 대응하는 수치 값을 예측하는 것이 목표입니다.

예를 들어 아래와 같은 회귀 모델을 만들 수 있습니다.

  • 부동산 가격 예측: 면적, 위치 등의 정보를 입력하면 아파트 가격을 예측

  • 주식 가격 예측: 과거 주식 데이터를 기반으로 미래 가격을 예측

  • 날씨 예측: 기온, 습도 등을 입력하면 내일의 기온을 예측


지도 학습의 한계

지도 학습은 가장 보편적으로 사용되는 AI 학습 방식이지만 다음과 같은 한계점이 있습니다.


1. 데이터가 많아야 한다

AI가 잘 학습하려면 대량의 데이터가 필요합니다.


2. 정확한 정답(Label)이 필요하다

데이터마다 정답이 있어야 하므로, 모든 데이터에 정답을 표기하는 레이블링(Labeling) 작업이 필요합니다.


3. 새로운 데이터에 약할 수 있다

훈련 데이터와 예측할 데이터가 너무 다르면 예측 성능이 떨어질 수 있습니다.


이러한 한계를 극복하기 위해 정답이 없는 데이터를 활용하는 비지도 학습이나, 보상을 통해 학습하는 강화 학습 방법도 머신러닝 학습에 사용됩니다.

다음 수업에서는 비지도 학습에 대해 알아보겠습니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!