AI가 '학습'한다는 것은 어떤 의미일까?
인공지능을 학습시키는 것은 많은 예시 데이터에서 특징을 추출해 패턴
을 배우고, 이를 기반으로 새로운 데이터를 정확하게 처리하는 능력을 기르는 것입니다.
조금 기술적으로 설명하자면, AI를 학습시키는 것은 새로 입력된 데이터에 대한 출력을 결정하는 알고리즘(특정 작업을 수행하기 위한 단계적 절차)을 만드는 것입니다.
스펨 이메일을 분류하는 AI를 학습시키는 과정을 통해, AI 학습 과정을 조금 더 자세히 알아보겠습니다.
1. 데이터 수집 및 전처리
먼저, AI 모델이 배울 수 있도록 많은 이메일 데이터를 준비하고, 이 데이터를 AI 모델이 이해할 수 있는 형태로 변환합니다. 이러한 과정을 전처리(Preprocessing)라고 합니다.
예를 들어 입력된 데이터에서 남성을 1, 여성은 0으로 변환하거나, 특정 단어를 일정한 규칙을 가진 숫자로 변환하는 것이 전처리 작업에 포함됩니다.
또한 누락된 데이터
를 처리하거나, 중복된 데이터
를 제거하는 것도 중요한 전처리 작업입니다.