AI는 질문을 어떻게 해석할까?
우리는 질문을 "의미"로 이해합니다. 하지만 AI는 질문을 사람처럼 읽지 않습니다. AI는 먼저 문장을 토큰 단위로 나누고, 그 토큰을 숫자로 바꾼 뒤 계산합니다. 즉, AI에게 질문은 "문장"이 아니라 숫자의 배열입니다.
이 차이를 이해하면 왜 같은 말을 조금 다르게 쓰면 답이 달라지는지, 왜 모호한 질문이 엉뚱한 결과로 이어지는지 자연스럽게 이해할 수 있습니다.
1. AI는 문장을 먼저 잘게 쪼갭니다
예를 들어 다음 질문을 보겠습니다.
프랑스의 수도는 어디인가요?
AI는 이 문장을 먼저 여러 조각(토큰)으로 나눕니다. 영어도, 한국어도 마찬가지입니다. 토큰은 단어와 정확히 일치하지 않습니다. 한 단어가 여러 조각으로 나뉠 수도 있고, 조사나 어미가 따로 떨어질 수도 있습니다.
이렇게 나뉜 토큰은 다시 각각 고유한 숫자로 변환됩니다. 결국 AI가 실제로 처리하는 것은 이런 형태에 가깝습니다.
[1543, 8921, 77, 5021, …]
이렇게 문장은 숫자의 배열로 바뀌고, AI는 이 숫자들을 기반으로 다음에 올 숫자 를 예측하는 방식으로 답변을 생성합니다.
2. 단어의 "순서"도 함께 계산합니다
AI는 단어 자체뿐 아니라 순서도 중요하게 다룹니다.
예를 들어 다음 두 문장을 비교해 보겠습니다.
- "고양이가 개를 쫓았다."
- "개가 고양이를 쫓았다."
단어는 거의 같지만, 의미는 완전히 다릅니다. AI는 이 차이를 "문법 규칙"으로 이해하는 것이 아니라, 학습 과정에서 본 수많은 문장 패턴을 바탕으로 확률적으로 구분합니다.
모델 내부에는 "어떤 단어 다음에 어떤 단어가 자주 나오는지"에 대한 거대한 통계 구조가 형성되어 있습니다. 그래서 단어 순서가 바뀌면, 뒤에 이어질 문장의 확률 구조도 달라집니다.
즉, AI는 문장의 뜻을 사전처럼 정의해서 이해하는 것이 아니라, 패턴과 관계를 수치로 계산해 이해합니다.
3. 모호한 질문은 왜 문제가 될까?
AI는 사람이 의도를 "눈치"로 보정해 줄 것이라고 기대하지 않습니다. 질문이 모호하면, 가능한 여러 해석 중에서 확률이 높은 방향