본문으로 건너뛰기
실습하기

AI가 '학습'한다는 것은 무엇을 의미할까?

AI가 스스로 문제를 해결하는 능력을 갖추려면 먼저 학습하는 과정이 필요합니다.

이번 시간에는 AI가 학습을 통해 지능을 어떻게 키우는지, 그리고 그 과정에서 중요한 개념들을 살펴보겠습니다.


AI가 학습한다는 것은?

AI가 학습한다는 것은 데이터를 통해 문제를 해결할 수 있는 모델을 만드는 과정입니다.

AI 모델은 입력 데이터를 받고, 입력 데이터를 처리해 원하는 결과를 출력하는 프로그램을 뜻합니다.

이 과정에서 중요한 두 가지 개념이 가중치편향입니다.


가중치 (Weight)

AI 모델이 입력 데이터를 처리할 때, 각 입력에 얼마나 중요한지 부여하는 값입니다.

가중치가 높을수록 해당 입력이 모델에 더 큰 영향을 미칩니다.

예를 들어, 이메일이 스팸인지 아닌지를 판별하는 모델에서, 특정 단어가 스팸 여부를 결정하는 데 더 중요하다면 해당 단어의 가중치가 높아집니다.


편향 (Bias)

AI 모델이 입력 데이터를 처리할 때, 얼마나 쉽게 적합한 결과를 출력할 수 있는지를 결정하는 값입니다.

편향이 높을수록 모델은 입력 데이터를 더 적극적으로 처리하게 됩니다.

AI를 학습시킨다는 것은 이러한 가중치와 편향을 여러 번 조정하며, 입력 데이터를 올바르게 처리할 수 있는 모델을 만들어내는 과정입니다.


데이터 수집 및 전처리 과정

AI 학습의 첫 번째 단계는 데이터를 수집하는 것입니다.

개와 고양이를 구분하는 AI를 만든다면, 수만장의 개와 고양이 사진 데이터가 필요하며, 텍스트를 생성하는 AI를 만든다면, 뉴스와 소설과 같은 텍스트 데이터가 필요합니다.

그러나 수집된 데이터가 모두 완벽한 것은 아니기 떄문에 반드시 전처리(Preprocessing) 과정이 필요합니다.

전처리는 데이터를 깨끗하게 만들고, AI 모델이 더 잘 학습할 수 있도록 돕는 과정을 뜻합니다.

주요 전처리 과정

  • 누락된 데이터 처리: 일부 데이터가 누락되었을 때 이를 보완하거나 제거합니다.

  • 데이터 정규화: 데이터의 범위를 일정하게 맞추어 모델이 학습하기 쉽게 만듭니다.

  • 데이터 증강: 학습에 필요한 데이터를 인위적으로 늘리는 과정으로, 이미지 회전이나 텍스트 변형 등이 포함됩니다.

전처리된 데이터는 AI 모델이 학습할 수 있는 준비된 자료가 됩니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!