IT정보/AI

OpenAI, 새로운 AI 모델 'OpenAI o1' 출시 : ChatGPT에 'Strawberry' 탑재

지식의 힘1 2024. 9. 13. 23:09
반응형

OpenAI는 코드명 'Strawberry' , 현재 'OpenAI o1'로 알려진 새로운 모델을 공식 출시하며 다시 한번 인공지능의 경계를 넓혔습니다. 이 최신 모델은 추론 능력을 향상해 과학, 코딩, 수학 등의 분야에서 보다 복잡한 문제를 해결할 수 있도록 설계되었습니다.

 

 

OpenAI o1

OpenAI o1 소개

10월 12일, OpenAI는 두 가지 버전의 모델을 공개했습니다:

 

· OpenAI o1 preview

· OpenAI o1 mini

 

두 모델 모두 ChatGPT 플러스, 팀, 엔터프라이즈, 에듀 구독 사용자가 사용할 수 있습니다. o1 시리즈는 응답을 생성하기 전에 “사고”에 더 많은 시간을 할애하도록 설계되어 이전 모델에 비해 더 복잡한 작업을 처리할 수 있습니다.

 

OpenAI o1

 

벤치마크에서의 탁월한 성능

OpenAI o1 모델은 다양한 벤치마크 테스트에서 괄목할 만한 개선이 입증되었습니다:

 

· 국제 수학 올림피아드(IMO) 예선 시험 : 83% 의 점수를 획득하여 이전 GPT 4o 모델의 점수인 13% 에서 크게 도약했습니다.

· 코딩 테스트 : 89번째 백분위수 에 도달하여 향상된 코딩 능력을 보여주었습니다.

· 물리학, 화학, 생물학 전반에 걸친 까다로운 벤치마크 과제에서 이 모델은 박사 과정 학생과 비슷한 수준의 성능을 보였습니다.

 

 

이러한 결과는 OpenAI o1이 단순한 점진적 업데이트가 아니라 AI 추론 능력에서 상당한 발전을 이루었음을 보여줍니다.

 

OpenAI o1

 

강화된 안전 조치

OpenAI는 이번 릴리스에서도 안전성을 최우선으로 고려했습니다. 가장 까다로운 탈옥 테스트 중 하나인 탈옥 테스트에서 o1 프리뷰는 84점 을 기록하여 GPT 4o의 22점 보다 크게 향상되었습니다. 이는 새 모델이 악성 프롬프트를 처리하고 적절한 대응을 생성하는 데 더 나은 역량을 갖추고 있음을 시사합니다.

 

서로 다른 요구사항에 맞춘 두 가지 모델

OpenAI o1 preview

이름에서 알 수 있듯이 o1 preview 는 정기적인 업데이트와 개선이 예상되는 미래의 모습을 미리 엿볼 수 있는 서비스입니다. 복잡한 작업을 위해 고급 추론이 필요한 사용자에게 이상적입니다.

 

OpenAI o1 mini

o1 mini 는 광범위한 일반 지식이 필요하지 않은 코딩 작업에 집중하는 개발자를 위한 비용 효율적인 옵션입니다. o1 preview보다 약 80% 저렴하여 더 다양한 애플리케이션에 사용할 수 있습니다.

 

사용 제한 및 가격

고급 추론에 상당한 계산 리소스가 필요하기 때문에 OpenAI는 사용 제한을 설정했습니다:

 

· o1 preview : 주당 30개 메시지로 제한

· o1 mini : 주당 50개 메시지로 제한

 

API 사용료는 월 $5~$1,000의 5단계로 재구성되었습니다. OpenAI는 이러한 비용 절감을 위해 적극적으로 노력하고 있으며, 주어진 프롬프트에 따라 ChatGPT가 가장 적합한 모델을 자동으로 선택할 수 있도록 하는 것을 목표로 하고 있습니다.

 

OpenAI의 과학적 기반 o1

테스트 시간 계산

OpenAI o1의 핵심 혁신 중 하나는 테스트 시간 계산 학습 방법을 채택한 것입니다. 이 접근 방식은 학습 중이 아닌 추론 중(테스트 시간)에 계산 노력을 높이는 데 중점을 둡니다. 이 개념은 특히 복잡한 추론 작업에서 '생각하는' 동안 더 많은 계산이 더 나은 성능으로 이어진다는 생각과 일치합니다.

 

생각의 연쇄 자동화

OpenAI는 사고의 연쇄(CoT) 프로세스를 자동화하여 모델의 “사고” 능력을 향상했습니다. 이제 사용자는 더 이상 모델이 문제를 단계별로 분석하도록 유도하기 위해 복잡한 프롬프트 엔지니어링에 관여할 필요가 없습니다. 이제 모델이 자체적으로 이를 수행합니다.

 

제한 사항 및 고려 사항

OpenAI o1은 데이터 분석, 코딩, 수학 등 추론 중심의 작업에서는 뛰어난 성능을 보이지만, 일부 자연어 작업에서는 사람의 선호도가 낮게 나타났습니다. 이는 이 모델이 모든 사용 사례에 가장 적합하지 않을 수 있음을 의미하며, 사용자는 자신의 특정 요구에 가장 적합한 모델을 선택해야 합니다.

 

미래 엿보기

OpenAI는 원어민도 의아해할 정도로 난해한 한국어 문장을 o1 모델이 성공적으로 영어로 번역한 흥미로운 사례를 공유했습니다. 이는 이 모델의 뛰어난 추론 능력을 보여줍니다.

 

예시
난해한 한국어 문장

 

OpenAI o1의 출시는 인공지능의 진화에 있어 중요한 이정표가 될 것입니다. AI 추론 기능을 크게 발전시킴으로써 OpenAI는 미래의 혁신을 위한 발판을 마련하고 있습니다. 회사는 다음과 같이 지속적인 개선에 대한 의지를 표명했습니다:

“우리는 계속 반복하여 개선된 버전을 출시할 계획입니다. 새로운 OpenAI o1 시리즈와 함께 GPT 시리즈의 모델을 지속적으로 개발 및 출시할 것입니다.”

 

 

챗GPT 데스크탑에 바로가기 설치하기

아래 설치 방법은 정식 앱은 아니므로 웹 버전의 챗GPT와 똑같은 기능을 가졌다고 생각하시면 됩니다. 바로가기의 장점은 한 번에 챗 GPT 실행 가능하다는 점입니다.    정식앱은 음성입력이나

niceman486.tistory.com

 

반응형