본문으로 건너뛰기
실습하기

이미지 생성 AI는 어떻게 만들어질까?

많은 분들께서 블로그 포스트 헤더 이미지를 만들거나, 간단한 그래픽 디자인 작업할 때 AI를 활용하고 있습니다.

OpenAI의 DALL-E, Stability AI의 Stable Diffusion과 같은 AI 모델은 텍스트 입력을 받아 이미지를 생성합니다.

이러한 이미지 생성 AI 모델은 어떻게 만들어지는 걸까요?

AI 모델마다 만들어지는 방식이 조금씩 다를 수 있지만, 큰 틀에서 아래와 같은 과정을 거칩니다.


1. 데이터 수집

먼저 대량의 이미지와 해당 이미지에 대한 텍스트 설명(Label, 라벨)을 모읍니다.

예를 들어 "강아지가 공원에서 뛰어 노는 사진"을 구하고, 이를 텍스트로 라벨링(Labeling)합니다.


2. 전처리

수집된 이미지와 텍스트 데이터는 컴퓨터가 이해할 수 있는 디지털 형태로 변환됩니다.


이미지 데이터

수집된 이미지는 화면을 구성하는 가장 작은 단위인 픽셀(px) 단위로 나뉘고, 각 픽셀은 RGB(Red 빨강, Green 초록, Blue 파랑) 값으로 표현됩니다.

예를 들어 빨간색은 (255, 0, 0)으로 표현되고, 검은색은 (0, 0, 0)으로 표현됩니다.


텍스트 데이터

텍스트는 단어(형태소) 단위로 분석됩니다.

예를 들어 "강아지가 공원에서 뛰어 노는 사진"이라는 텍스트는 "강아지", "가", "공원", "에서", "뛰어", "노는", "사진"으로 분리됩니다.

또한, 각 단어는 컴퓨터가 이해할 수 있는 숫자로 변환됩니다. 이를 임베딩(Embedding)이라고 합니다. 예를 들어, 고양이라는 단어는 다음과 같은 벡터(Vector, 단어나 문장을 숫자로 표현한 것)로 변환될 수 있습니다.

고양이의 벡터 값
[0.11, 0.34, 0.56, ...]

3. AI 모델 학습

AI는 쉽게 말해 수학시간에 배운 함수 (Function)와 같습니다.

이미지 생성 AI 모델은 입력된 텍스트와 이미지 사이의 연관성을 학습시키며, 함수의 입력과 출력에 영향을 미치는 파라미터(Parameter, 매개변수)를 조정합니다.

파라미터는 이미지 생성 AI 모델이 입력된 텍스트와 이미지를 연결하고 결과를 만들기 위해 조정되는 숫자들로, 마치 요리할 때 맛을 조절하기 위해 사용하는 양념과 같은 역할을 합니다.

이 과정을 통해 최적의 파라미터를 찾은 AI 모델은 주어진 텍스트 설명을 바탕으로 이미지를 생성할 수 있게 됩니다.

다음 내용이 궁금하다면?

코드프렌즈 PLUS 멤버십 가입 or 강의를 등록해 주세요!