"홤잠실이 넘무 작암욤(화장실이 너무 작아요)."
숙소 예약 서비스인 '에어비앤비'에서 부정적인 후기가 삭제되지 않도록 하기 위해 한글을 이리저리 비틀어 활용됐던 '에어비앤비체'가 앞으로 큰 효과가 없을 것으로 보인다. 생성형 인공지능(AI) 돌풍을 일으킨 '챗GPT' 개발사 오픈AI가 추론 능력을 갖춘 새로운 무기로 망가진 한국어 문장의 의미를 정확히 파악하기 시작했기 때문이다.
16일 업계에 따르면 오픈AI가 지난 12일 공개한 'o1' 모델은 문법이 파괴돼 한국인만 이해할 수 있는 한국어 문장들을 정확하게 해석해 영어로 번역했다.
정형원 오픈AI 연구원은 이날 공개된 영상에서 '직우상 얻떤 번역깃돋 일끌 슈 없쥐많 한국인듦은 쉽게 앗랍볼 수 있는 한끌의 암혼화 방펍잇 잊다'는 문장을 기록했다. 이는 '지구상 어떤 번역기도 읽을 수 없지만 한국인들은 쉽게 알아볼 수 있는 한글의 암호화 방법이 있다'는 문장을 문법에 전혀 맞지 않게 쓴 것이다. 그러나 'o1'은 '노 트랜스레이터 온 어스 캔 두 디스, 벗 코리안즈 캔 이즐리 리코나이즈 잇(No Translator on Earth can do this, but Koreans can easily recognize it)'이라고 정확히 번역했다. 반면 구글, 딥엘 등 다른 번역기는 문장을 제대로 인지하지 못해 오역을 했다.
'o1'은 기존 모델에 비해 응답 속도는 다소 느리다. 프롬프트(명령어)를 입력하면 답변하기 전에 '생각 중', '정확한 주장 검토 중' 등의 문장이 나온다. 하지만 'CoT(Chain of Thought·생각의 연결고리)' 기법을 사용해 단계적인 사고 과정을 거쳐 답을 내놓기 때문에 어렵고 복잡한 문제도 해결할 수 있다.
'o1'은 거대언어모델(LLM)을 기반으로 한 기존 AI 모델의 약점인 '사고 능력'을 대폭 향상시킨 것이 특징으로, 수학과 과학 분야에서도 우수한 성능을 보였다. 오픈AI에 따르면 o1은 국제수학올림피아드(IMO) 예선 시험에서 83%의 정답률을 나타냈다. 이전 모델인 GPT-4o는 정답률이 13%에 불과했다.
'o1'은 코딩 능력도 대폭 향상됐다. 오픈AI가 공개한 영상에서 'o1'은 프롬프트만으로도 게임을 프로그래밍 했다. '비디오 게임을 만들기 위한 코드를 만들어줘'라고 콘셉트, 캐릭터 등을 설명하면 게임을 만들어주는 식이다.
'o1'는 챗GPT 플러스 등 유료 이용자들을 대상으로 제공되고 있으며 기본 모델 'o1-프리뷰'와 소형 모델 'o1-미니'로 구성됐다. 주간 사용 메시지 한도는 'o1-프리뷰'가 30개, 'o1-미니'가 50개다.
업계에선 추론이 가능한 오픈AI 'o1'의 등장으로 범용인공지능(AGI) 개발 속도가 더 빨라질 것으로 봤다. 또 구글, 앤트로픽 등 경쟁사들도 최근 추론 능력을 끌어올린 AI 모델 개발에 적극 나서고 있지만, 오픈AI가 독주 체제를 유지하고 있는 만큼 AGI에 가장 먼저 도달할 것이란 예상이 많다.
오픈AI는 AI 능력을 수준에 따라 5단계로 나누고 AGI를 AI 모델 5단계이자 최종 목표로 설정했다. 'o1'은 2단계, GPT 등 대부분의 서비스들은 1단계에 해당한다.
샘 올트먼 오픈AI 최고경영자(CEO)는 "'o1'은 새로운 패러다임"이라며 "복잡한 문제를 추론할 수 있는 AI 모델"이라고 말했다.
관련기사
- "물러서면 끝"…'적자 7兆' 오픈AI, 新 투자로 '쩐의 전쟁' 불 붙인다2024.08.29
- "올해 적자만 최대 7조"…기업 공략 나선 오픈AI, 수익 확대 본격화2024.08.21
- "그녀 목소리 빠졌네?"…오픈AI, 논란 많던 'GPT-4o' 음성 기능 제한적 공개2024.07.31
- "챗GPT는 레벨1"…오픈AI, AGI 기술 달성 계획 5단계로 나눠2024.07.12
하지만 여전히 기술적 결함은 곳곳에서 드러나 아쉽다는 평가도 있었다. 한 사용자가 '9.11보다 9.9가 더 작은가'라고 질문하자 'o1'은 4초 후 '그렇다'고 잘못된 대답을 내놨다.
올트먼 CEO는 "이 기술은 여전히 결함이 있고 제한적"이라며 "AGI 단계로 나아가기엔 부족함이 많다"고 설명했다.