목차
OpenAI가 새로운 AI 모델인 GPT-4o 미니를 공개했습니다. 이 모델은 훨씬 더 저렴하면서도 지능적이고, GPT-3.5 터보만큼 빠릅니다. GPT-4o와 마찬가지로 GPT-4o 미니도 128k 컨텍스트 윈도우와 2023년 10월까지의 데이터 컷오프일(정보의 최종 수집일)를 갖추고 있습니다.
GPT-4o 미니란?
GPT-4o 미니는 더 큰 모델에 비해 비용 효율적이고 접근하기 쉽게 설계되었습니다.
새로운 모델의 주요 특징은 다음과 같습니다:
- 지능: GPT-4o 미니는 텍스트 지능에서 GPT-3.5 터보를 능가하며, MMLU에서 82%의 점수를 기록해 69.8%를 기록한 GPT-3.5 터보보다 뛰어납니다. 또한 멀티모달 추론에서도 뛰어난 성능을 보입니다.
- 가격: GPT-4o 미니는 GPT-3.5 터보보다 60% 이상 저렴하며, 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트의 비용이 듭니다. 이는 표준 책의 약 2,500페이지에 해당합니다.
- 모달리티: GPT-4o 미니는 현재 텍스트와 비전 기능을 지원합니다. OpenAI는 미래에 오디오와 비디오 입력 및 출력을 지원할 계획입니다.
- 언어: GPT-4o 미니는 GPT-3.5 터보보다 향상된 다국어 이해력을 갖추고 있으며, 다양한 비영어권 언어에서 더 뛰어난 성능을 보입니다.
재미있는 사실: GPT-4o 미니의 토큰당 비용은 2022년에 도입된 덜 강력한 모델인 text-davinci-003 이후 99% 감소했습니다.
평가 기준
GPT-4o 미니는 작은 모델이지만 텍스트 지능과 멀티모달 추론에서 탁월한 성능을 발휘하며, 여러 학술 벤치마크에서 GPT-3.5 터보 및 다른 작은 모델들을 능가합니다. 또한 GPT-4o와 동일한 범위의 언어를 지원하며, 함수 호출과 장기 컨텍스트 작업에서도 뛰어난 성능을 보여줍니다.
주요 평가 점수:
- 추론 작업: MMLU에서 82.0%를 기록하여, 제미니 플래시의 77.9%와 클로드 하이쿠의 73.8%를 능가합니다.
- 수학 및 코딩 능력: MGSM(수학 추론)에서 87.0%, HumanEval(코딩)에서 87.2%를 기록하여 제미니 플래시와 클로드 하이쿠를 능가합니다.
- 멀티모달 추론: MMMU에서 59.4%를 기록하여 제미니 플래시와 클로드 하이쿠를 능가합니다.
API 가격
OpenAI는 GPT-4o 미니의 가격을 매우 저렴하게 책정했습니다:
- 입력 토큰 100만 개당 15센트
- 출력 토큰 100만 개당 60센트
아래는 각 모델 변형에 대한 자세한 가격 정보입니다.
앱 개발에 소규모 언어 모델을 사용하는 개발자나 스타트업이라면, API 비용을 절감하기 위해 지금 GPT-4o 미니로 전환하는 것을 추천합니다.
GPT-3.5는 컨텍스트 윈도우가 16K에 불과해 비용이 훨씬 더 비쌉니다.
GPT-4o 미니는 이미지 생성도 지원합니다. 비전 가격에 관심이 있다면, 이 계산기를 확인해보세요. 1080 x 1080 픽셀 이미지는 $0.003825의 비용이 듭니다.
저는 아직 API를 통해 비전 모달리티를 사용해보지 않았습니다. OpenAI에 따르면, 이미지, 비디오, 오디오 입력 및 출력 지원은 "곧 제공될 예정"이라고 합니다.
직접 사용해보세요
이제부터 ChatGPT 무료, 플러스, 팀 사용자는 GPT-3.5 대신 GPT-4o 미니를 사용할 수 있습니다. 엔터프라이즈 사용자는 다음 주부터 접근할 수 있으며, 이는 AI의 혜택을 모든 이들이 누릴 수 있도록 하려는 OpenAI의 사명에 부합합니다.
다른 모델과 비교해보고 싶다면, 이제 https://arena.lmsys.org/ 에서 GPT-4o 미니를 확인할 수 있습니다.
LMSYS는 대중의 투표를 통해 GPT-4 터보와 동등한 성능을 유지하면서도 더 저렴한 비용으로 평가되었습니다.
6천 명 이상의 사용자 투표 결과, GPT-4 터보 수준의 성능을 제공하면서도 비용을 크게 절감한 초기 점수를 발표하게 되어 기쁩니다 (입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트).
개발자를 위해 이제 VS Code의 코드 어시스턴트 확장에서 GPT-4o 미니를 지원합니다.
Microsoft도 GPT-4o 미니가 이제 Microsoft Azure AI에서 지원된다고 발표했습니다.
마무리
저는 GPT-4o 미니의 가격, 멀티모달 기능, 그리고 벤치마크에서 보여주는 응답 시간이 매우 마음에 듭니다. GPT-3.5 터보와 비교할 때 큰 도약처럼 느껴집니다. 더 많은 컨텍스트와 가능성을 훨씬 저렴한 가격에 제공합니다.
제 제품을 GPT-3.5 터보에서 GPT-4o 미니로 바꿀 가치가 있는지 직접 평가해보는 것이 기대됩니다.
하지만 API가 저렴하다고 해도, Llama 3 같은 오픈 소스 모델의 장점을 능가하지는 못합니다. 오픈 소스 모델은 사용자가 자신의 데이터로 미세 조정하고 자체 하드웨어에서 실행할 수 있게 해주어, 일부 사용자에게 큰 이점을 제공합니다.
지금까지 GPT-4o 미니에 대해 간단히 알아보았습니다.
읽어주셔서 감사합니다! 😊
개발 관련 궁금증이나 고민이 있으신가요?
아래 링크를 통해 저에게 바로 문의해 주세요! 쉽고 빠르게 도움 드리겠습니다.
A.I. 관련 도움이 될만한 사이트 :
https://devloo.io/category/artificial-intelligence/
'Development > Artificial Intelligence' 카테고리의 다른 글
[챗 GPT/chatgpt] Meta LLaMA vs ChatGPT: 완벽 비교 분석 (0) | 2024.08.01 |
---|---|
[SearchGPT] 최고의 검색 엔진 등장! OpenAI의 SearchGPT에 대해서 (0) | 2024.07.29 |
판매를 폭발적으로 늘려줄 ChatGPT 프롬프트 8가지 (1) | 2024.07.14 |
ChatGPT를 활용하여 이미지 색상 추출하기 (0) | 2024.07.10 |
RAG란 무엇인가? — 검색 증강 생성(RAG)의 자세한 설명 (0) | 2024.07.04 |