본문으로 건너뛰기

영화 "Her"가 현실로, GPT-4o 출시

thumbnail-320

2013년 개봉한 영화 Her는 인공지능(AI)과 인간 사이의 감정적 관계를 탐구하는 작품으로, 인공지능의 특이점을 잘 표현한 영화라는 평을 받았습니다.

Her는 가까운 미래를 배경으로, 감정적으로 고립된 주인공 테오도르(호아킨 피닉스 역)가 첨단 AI 운영체제(OS)와 사랑에 빠지는 이야기를 그립니다.

사만다(스칼렛 요한슨 목소리)는 테오도르의 일상 속에 깊이 스며들어 그를 감정적으로 지원하고, 두 사람은 그녀와 깊은 유대감을 형성하게 됩니다.

영화 Her는 인간과 AI 사이의 감정적 유대가 어떻게 형성되는지를 다루며, AI가 발전되면 어떤 변화가 일어날지를 상상하게 만들었습니다.

11년이 지난 지금, 우리는 이 영화가 제시한 미래에 정말 가까워 졌습니다.

5월 13일에 출시된 오픈AI의 생성형 AI 최신 모델, GPT-4o의 출시와 함께 영화 속 이야기와 현실의 경계가 점점 희미해지고 있습니다.

GPT-4o: 현실로 다가온 "Her"


GPT-4o("o"는 모든 방식의, 모든 곳에를 뜻하는 "omni"를 의미)는 눈부시게 발전하는 AI 기술의 최전선에 있는 모델입니다.

이전 모델인 GPT-4 Turbo에 비해 2배 빠른 성능을, 5배 높은 속도 제한(rate limits)으로 활용할 수 있습니다.

위 데모에서 보신 것처럼 사용자의 음성 입력을 232ms(0.232초)만에, 평균적으로 320ms(0,32초)에 응답할 수 있습니다. 이는 일반적인 인간의 반응 속도와 유사한 수준입니다.

이뿐만 아니라 API를 통한 처리 속도가 훨씬 빨라졌으며, 비용은 50% 저렴해졌습니다.


비전(Vision) 및 오디오 이해 능력 개선

GPT-4o는 이전 모델들에 비해 특히 시각적 이해오디오 이해 능력이 향상되었습니다.

이전 모델에서는 오디오 입력을 텍스트로 변환하고, 텍스트를 받아 GPT-3.5나 GPT-4로 응답을하고, 그리고 그 텍스트를 다시 오디오로 변환하는 복잡한 과정이 필요했습니다.

이 과정에서 다수의 중요한 정보가 손실되었습니다. 예를 들어 GPT-4는 톤, 다수의 발화자, 배경 소음을 직접 관찰할 수 없었고, 웃음, 슬픔과 같은 감정 표현을 할 수 없었습니다.

GPT-4o는 텍스트, 비전, 오디오를 아우르는 단일 모델을 처음부터 끝까지 훈련시켜, 모든 입력과 출력을 같은 신경망이 처리합니다.

이는 텍스트, 이미지, 오디오등 모든 모달리티를 통합한 첫번째 모델로서, 다양한 매체를 통한 상호작용을 지원합니다.


더 적은 토큰으로, 더 많은 정보를

GPT-4o는 한국어, 일본어, 중국어 등 다양한 언어에 대한 토큰 압축 및 최적화를 통해, 더 적은 토큰으로 더 많은 정보를 표현할 수 있습니다.

예를 들어

안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다, 만나서 반갑습니다!

라는 한국어 문장에 대한 토큰 사용량은 기존 45 토큰에서 27 토큰으로 줄어들었습니다.

오픈AI는 힌두어, 베트남어, 스페인어 등 20개 언어에 대한 토큰 최적화 통계를 제시했습니다.

token-stats

출처: https://openai.com/index/hello-gpt-4o/


GPT-4o 활용 실시간 번역 데모 영상



GPT-4o는 어떻게 사용하나요?

GPT-4o의 텍스트, 이미지 처리 모델은 5월 13일 론칭 행사와 동시에 공개되었습니다.

GPT-4o는 챗GPT 무료 티어에서도 사용 가능하며, 유료 플랜을 구독 중이신 Plus 사용자에게는 무료 사용자에 비해 5배 많은 메시지 한도가 제공됩니다. 데모로 공개된 음성 모드는 몇 주 내에 ChatGPT Plus에서 알파 버전으로 출시될 예정입니다.

또한, 개발자 분들은 API를 통해 GPT-4o는 텍스트와 비전(이미지) 모델을 사용할 수 있습니다.


챗GPT를 가장 잘 활용하려면?

GPT와 같은 생성형 AI 모델을 200% 활용하려면, "잘 질문하는 능력"이 중요합니다.

이렇게 잘 질문하는 능력을 기술적으로 정리한 것을 프롬프트 엔지니어링 이라고 합니다.

코드프렌즈는 챗GPT를 어떻게 활용할지 막막하신 분들, 동문서답하는 챗GPT가 답답하신 분들을 위한 프롬프트 엔지니어링 학습 콘텐츠와 실습 환경 출시를 앞두고 있습니다.

코드프렌즈를 팔로우하고, 챗GPT를 200% 활용하는 방법을 배워보세요!


코드프렌즈 더 알아보기: https://www.codefriends.net/