AI가 답변을 확률적으로 생성하는 원리
앞서 추론에서 살펴본 것처럼, AI 추론의 핵심은 이미 학습된 가중치 행렬을 이용해 새로운 입력에 대한 다음 상태를 계산하는 것입니다.
추론을 통한 텍스트 생성 역시 답변할 문장을 통째로 만들어 내는 방식이 아닙니다. 지금까지 이미 생성된 텍스트를 바탕으로, 그 다음에 올 토큰을 확률적으로 계산하고 선택하는 과정을 반복합니다. 이 반복이 이어지면서 하나의 문장이 완성됩니다.
문장은 어떤 방식으로 만들어질까요?
예를 들어 사용자가 다음과 같이 질문했다고 하겠습니다.
사용자 질문 예시
고등학생에게 AI를 쉽게 설명해줘.