본문으로 건너뛰기
실습하기

다양한 AI 종류와 생성형 AI

앞 장에서 우리는 AI가 어떻게 학습하고, 지적 활동을 어떻게 수행하는지 살펴봤습니다. 이번 장에서는 AI의 대표적인 유형들을 실제 사례와 함께 이해해 보겠습니다. 그리고 생성형 AI가 기존 AI와 무엇이 다른지, 왜 이렇게 빠르게 발전하고 있는지 살펴보겠습니다.

헤더 이미지

AI는 크게 네 가지 유형으로 나눌 수 있습니다.

  • 인식: 무엇인지 맞히기
  • 예측: 다음에 무엇이 일어날지 예측하기
  • 결정: 무엇을 해야 할지 선택하기
  • 생성: 새로운 결과물을 만들어내기

이 네 가지가 섞여 하나의 서비스가 되기도 합니다. 예를 들어 자율주행은 "인식"과 "결정"이 함께 필요하고, 유튜브 추천은 "예측"이 핵심이며, 챗봇은 "생성"이 중심이 됩니다.

1. 인식 AI: 세상을 '구분'하는 능력

인식 AI는 입력된 정보가 무엇인지 분류하고 식별하는 AI입니다. 정답이 이미 정해져 있는 문제를 해결하는 데 강하며, 주로 구조화되지 않은 데이터를 다룹니다.

비정형 데이터란?

이처럼 구조화되지 않은 데이터를 비정형 데이터라고 합니다. 비정형 데이터는 엑셀 시트나 표처럼 행과 열에 맞추어 정리된 데이터가 아니라, 사진·음성·영상·자유롭게 작성된 문장처럼 일정한 형식이나 구조가 정해져 있지 않은 데이터를 말합니다.

이미지 인식: 사진 속 대상을 식별하기

스마트폰 사진 앱에서 사진이 "고양이", "바다", "음식" 등으로 자동 분류되는 기능은 인식 AI의 대표적인 활용 사례입니다. 사진은 사람이 보기에는 하나의 이미지이지만, 컴퓨터 내부에서는 수많은 픽셀 값의 집합으로 표현됩니다. 인식 AI는 대량의 예시 이미지를 학습하면서 특정 대상이 공통적으로 가지는 숫자 패턴을 익히고, 새로운 이미지가 입력되면 기존에 학습한 패턴과 비교하여 각 대상일 확률을 계산한 뒤 가장 가능성이 높은 결과를 선택합니다.

실제 활용 예시는 다음과 같습니다.

  • 스마트폰 얼굴 인식 잠금 해제: 얼굴의 특징점(눈, 코, 입의 위치와 비율 등)을 분석하여 등록된 사용자와 일치하는지 확인합니다.
  • SNS 자동 태그 추천: 사진 속 인물을 식별하여 특정 인물일 가능성을 제안합니다.
  • 텍스트 OCR(광학 문자 인식): 이미지 속 글자를 인식하여 컴퓨터가 처리할 수 있는 텍스트 데이터로 변환합니다. 예를 들어 영수증 사진에서 가게 이름, 날짜, 금액 등의 정보를 자동으로 추출할 수 있습니다.

이미지 인식

음성 인식: 말소리를 '글자'로 바꾸기

앞서 살펴본 것처럼 사람이 듣는 "안녕하세요"라는 말소리는 컴퓨터에게는 시간에 따라 변화하는 진동 값의 숫자 배열입니다. 마이크는 공기의 진동을 전기 신호로 바꾸고, 이 신호는 다시 수많은 숫자로 변환됩니다. 인식 AI는 이러한 숫자 패턴을 분석해 어떤 발음에 해당하는지 판단하고, 이를 문자로 변환합니다.

실사용 예시는 다음과 같습니다.

  • 통화 녹음 자동 자막: 통화 내용을 음성에서 텍스트로 변환해 기록합니다.
  • 회의 자동 기록: 발표자의 말을 실시간으로 받아 적어 회의록을 생성합니다.
  • 음성 명령 인식: "타이머 10분"과 같은 짧은 명령을 인식해 해당 기능을 실행합니다.

음성 인식

의료 영상 판독: 정상과 비정상 구분

의료 분야에서는 "정상인지 아닌지"를 구분하는 일이 매우 중요합니다. 인식 AI는 X-ray, CT, MRI와 같은 의료 영상을 분석해 이상 징후가 의심되는 영역을 표시하고, 의사의 판단을 보조합니다. 여기서 중요한 점은 AI가 진단을 대신 내리는 것이 아니라, 사람이 놓칠 수 있는 미세한 패턴을 먼저 탐지하여 의사에게 추가적인 정보를 제공하는 역할을 하는 경우가 많다는 것입니다.

인식 AI의 핵심 기준은 정확도입니다. 오분류가 발생하면 안전 문제나 비용 손실로 이어질 수 있기 때문에, 모델의 성능은 엄격한 평가 과정을 통해 검증됩니다.

2. 예측 AI: 다음을 '맞히는' 능력

예측 AI는 정답이 하나로 고정되어 있지 않은 문제를 다룹니다. 대신 다양한 가능성을 계산하고, 그중에서 확률이 높은 결과를 제시합니다. 즉, 무엇이 일어날지를 단정하는 것이 아니라, "어떤 일이 일어날 가능성이 높은가"를 계산하는 것이 핵심입니다.

추천 시스템: 다음에 무엇을 선택할지 계산하기

유튜브, 넷플릭스, 멜론과 같은 서비스는 사용자가 다음에 무엇을 볼지(또는 들을지) 예측합니다. 겉으로 보면 사용자의 취향을 이해하는 것처럼 보이지만, 실제로는 행동 데이터의 패턴을 분석하는 과정에 가깝습니다.

예를 들어 추천 시스템은 다음과 같은 정보를 활용합니다.

  • 어떤 영상을 클릭했는지
  • 얼마나 오래 시청했는지(완주율)
  • 중간에 스킵했는지
  • 비슷한 행동 패턴을 보이는 사용자들이 무엇을 선택했는지

이 데이터를 기반으로 "이 사용자는 다음에 이 콘텐츠를 선택할 확률이 높다"라고 계산하여 추천 목록을 구성합니다. 우리가 어느 순간부터 플랫폼이 내 취향을 잘 아는 것처럼 느끼는 이유는, 실제로는 취향 그 자체가 아니라 행동 패턴의 통계적 유사성을 기반으로 예측하기 때문입니다.

수요 예측: 얼마나 필요할지를 계산하기

예측 AI는 미래의 수요를 계산하는 데에도 활용됩니다. 예를 들어 편의점에서 도시락이 지나치게 많이 남으면 손해이고, 너무 적게 준비해도 판매 기회를 놓치게 됩니다. 예측 AI는 날짜, 요일, 날씨, 지역 특성, 시험 기간이나 명절 같은 이벤트 정보를 종합하여 판매량을 예측합니다.

실사용 예시는 다음과 같습니다.

  • 배달 앱: 특정 시간대에 주문이 급증할 가능성을 예측해 배달비 정책이나 배차 전략을 조정합니다.
  • 대중교통 시스템: 시간대별 혼잡도를 예측해 배차 간격을 조정합니다.
  • 학교 급식 운영: 특정 메뉴에 대한 선호도를 예측해 준비 수량을 결정하는 데 참고합니다.

이상 징후 예측: 위험 신호를 조기에 탐지하기

예측 AI는 문제가 발생한 이후가 아니라, 발생하기 이전의 신호를 탐지하는 데에도 사용됩니다. 이는 위험 관리와 밀접하게 연결됩니다.

  • 금융 사기 탐지: 평소와 다른 결제 시간, 지역, 금액 패턴을 분석해 사기 가능성을 경고합니다.
  • 서버 장애 예측: 트래픽 증가 추세나 오류 로그의 변화 패턴을 분석해 장애 가능성을 사전에 예측합니다.

예측 AI의 핵심은 확률 계산과 위험 관리입니다. 100% 정확한 답을 내는 것이 목표가 아니라, 제한된 정보 속에서 가장 가능성이 높은 선택지를 제시하고, 잠재적인 위험을 조기에 감지하는 것이 목적입니다.

3. 결정 AI: 무엇을 '해야 할지' 선택하는 능력

결정 AI는 단순히 정답을 분류하거나 미래를 예측하는 수준을 넘어, 목표를 달성하기 위해 어떤 행동을 선택할지 결정하는 AI입니다. 여기에는 보통 보상(reward)이라는 개념이 사용됩니다. 보상이란 특정 행동이 얼마나 좋은 결과를 가져왔는지를 숫자로 평가한 값입니다. 좋은 결과를 낳는 행동에는 높은 보상을, 바람직하지 않은 결과를 낳는 행동에는 낮은 보상을 주도록 설계합니다. AI는 이러한 보상을 최대화하는 방향으로 행동을 학습합니다.

자율주행: 인식과 결정의 결합

자율주행 시스템은 인식 AI와 결정 AI가 함께 작동하는 대표적인 사례입니다. 먼저 카메라와 센서를 통해 보행자, 신호등, 차선, 주변 차량을 인식합니다. 그 다음 단계에서 "멈출지, 속도를 줄일지, 차선을 변경할지"와 같은 행동을 선택합니다. 이때 중요한 것은 단순히 빠르게 이동하는 것이 아니라, 안전과 교통 규칙을 동시에 만족하는 선택을 해야 한다는 점입니다.

실사용 예시는 다음과 같습니다.

  • 보행자가 가까이 접근하면 감속하거나 정지
  • 앞차가 급정거하면 즉시 제동
  • 신호등이 바뀌는 시점을 고려해 출발 시점 조절

이처럼 다양한 상황을 종합적으로 고려해 가장 적절한 행동을 선택하는 것이 결정 AI의 역할입니다.

게임 AI: 목표를 향한 전략 선택

게임 분야에서도 결정 AI가 활용됩니다. 대표적인 사례로 바둑 AI인 알파고가 있습니다. 바둑판의 현재 상태를 분석한 뒤, "어떤 수가 승률을 가장 높이는가"를 계산하여 한 수를 선택합니다. 이는 단순히 정해진 규칙을 따르는 것이 아니라, 방대한 대국 데이터를 학습하고 수많은 경우의 수를 시뮬레이션하여 가장 유리한 선택을 찾아내는 과정입니다.

결정 AI의 핵심은 목표와 평가 기준의 설정입니다. 무엇을 성공으로 볼 것인지, 어떤 결과에 높은 점수를 줄 것인지에 따라 AI의 행동은 완전히 달라집니다. 따라서 결정 AI에서는 알고리즘 자체뿐만 아니라, 목표를 어떻게 정의하고 보상을 어떻게 설계할 것인지가 매우 중요합니다.

4. 생성형 AI: 새로운 결과물을 만드는 AI

생성형 AI는 기존의 AI처럼 정답을 분류하거나 선택하는 데서 그치지 않고, 새로운 문장, 이미지, 소리, 영상과 같은 결과물을 만들어내는 AI입니다. 그래서 많은 사람들에게 인공지능의 가능성을 다시 생각하게 만든 기술입니다.

생성형 AI는 어떻게 활용되나요?

생성형 AI는 다양한 상황에서 초안을 만들고 아이디어를 정리하는 데 활용됩니다.

  • 학생: 글 요약, 개념 정리, 질문에 대한 답변, 발표문 초안 작성
  • 교사: 수업 계획서 초안, 시험 문제 아이디어 제안, 수행평가 루브릭 설계
  • 직장인: 회의록 정리, 이메일 초안 작성, 보고서 목차 구성, 코드 작성 보조
  • 디자이너 및 콘텐츠 제작자: 이미지 시안 제작, 광고 문구 작성, 배경 음악 생성, 영상 스토리보드 초안 구성

중요한 점은 생성형 AI가 완전히 새로운 것을 '무에서 창조'하는 것이 아니라는 사실입니다. 방대한 학습 데이터에서 패턴을 학습한 뒤, 그 패턴을 바탕으로 새로운 조합을 만들어내는 방식으로 결과물을 생성합니다.

생성은 결국 예측의 연속입니다.

생성형 AI는 완성된 결과물을 한 번에 만들어내는 것이 아니라, 아주 작은 단위의 예측을 빠르게 반복하면서 점진적으로 결과를 구성합니다. 각 분야에서 이 예측이 어떤 단위로 이루어지는지 이해하면 원리를 더 명확하게 볼 수 있습니다.

  • 텍스트 생성: 다음에 올 단어(또는 토큰)를 하나씩 예측합니다. 이렇게 예측된 단어들이 순차적으로 이어지면서 문단과 글이 완성됩니다.
  • 이미지 생성: 픽셀의 색과 밝기 값, 혹은 이미지의 노이즈 패턴을 단계적으로 예측하고 수정하면서 전체 이미지를 점점 또렷하게 만듭니다.
  • 음성 생성: 시간의 흐름에 따라 이어질 소리의 파형 값이나 음성 특징을 연속적으로 예측하여 자연스러운 음성을 구성합니다.
  • 영상 생성: 연속된 장면에서 다음 프레임의 이미지 변화를 예측하여 움직임이 자연스럽게 이어지도록 만듭니다.

이처럼 생성형 AI는 "창작"을 하는 것처럼 보이지만, 실제로는 확률적으로 가장 자연스러운 다음 단계를 계속 이어 붙이는 과정에 가깝습니다. 작은 예측이 수백, 수천 번 반복되면서 하나의 글, 이미지, 음성, 영상이 완성됩니다.

이처럼 작은 예측이 연속적으로 이어지면서 하나의 문서, 한 장의 이미지, 하나의 음성 파일, 또는 하나의 영상이 완성됩니다. 따라서 생성형 AI는 예측을 연속적으로 수행하여 결과물을 구성하는 AI라고 이해할 수 있습니다.

5. 생성형 AI와 다른 AI는 무엇이 다른가요?

생성형 AI는 인식·예측·결정 AI와는 다른 방식으로 작동합니다. 인식·예측·결정 AI는 주로 "구분"과 "선택"에 초점을 맞추지만, 생성형 AI는 "표현과 생산"에 초점을 맞춥니다. 아래 표에서 각 유형의 AI가 어떤 질문에 답하는지, 어떤 형태의 출력을 내놓는지, 그리고 대표적인 예시가 무엇인지 비교해 보겠습니다.

구분인식 AI예측 AI결정 AI생성형 AI
대표 질문"이게 뭐야?""다음엔 뭐가 일어나?""뭘 해야 해?""새로 만들어줘"
출력 형태분류 결과확률/점수행동 선택문장/이미지/코드
대표 예시얼굴 인식, 음성 인식추천 시스템, 수요 예측자율주행, 게임 AI챗봇, 이미지 생성

다음 장에서는 AI가 학습하는 과정에 대해 깊이 있게 살펴보겠습니다.