OpenAI가 제공하는 API 모델에 관한 기본 정보와 비용을 요약한 문서입니다. 이 문서가 OpenAI 모델로 서비스를 개발하는 모든 분들께 도움이 되기를 바랍니다.
1. 이 문서는 OpenAI의 가격 정책 페이지, 모델 소개 페이지, 블로그 포스팅의 핵심 정보를 번역한 문서입니다.
2. PC 환경에 최적화된 문서입니다.
3. 이 문서는 계속 업데이트됩니다.
(최종 업데이트: 2024년 5월 26일)
OpenAI API 비용은 대부분 1,000(1K) 토큰 기준입니다. 1,000토큰은 영단어 약 750단어 (1토큰: 약 0.75단어)에 해당하는 것으로 OpenAI 홈페이지에 언급되어 있습니다.
OpenAI API 모델별 기본 정보
지금부터 모델별 기본 정보 및 비용을 안내하겠습니다.
모델별 기본 정보 및 비용
2024년 5월 공개된 GPT-4o 모델은 멀티모달을 지원하며, GPT-4 대비 텍스트를 두 배 더 빠르게 생성하는데 가격은 50%입니다. GPT-4o의 영어 및 코딩 능력은 GPT-4와 동등한 수준이며, 비영어권 언어에 대해서는 최고의 성능을 제공합니다.
모델명 | 토큰 | 데이터 학습 | 입력 (1K) | 출력 (1K) | |
GPT-4o | gpt-4o | 128,000 | 23년 10월 | $0.005 | $0.015 |
gpt-4o-2024-05-13 | 128,000 | 23년 10월 | $0.005 | $0.015 | |
GPT-4-Turbo | GPT-4 turbo with Vision | 128,000 | 23년 12월 | $0.01 | $0.03 |
gpt-4-turbo-2024-04-09 | 128,000 | 23년 12월 | $0.01 | $0.03 | |
GPT-4 | gpt-4 | 8,192 | 21년 9월 | $0.03 | $0.06 |
gpt-4-32K | 32,768 | 21년 9월 | $0.06 | $0.12 | |
GPT-3.5 Turbo | gpt-3.5-turbo-0125 | 16,385 | 21년 9월 | $0.0010 | $0.0020 |
gpt-3.5-turbo-instruct | 4,096 | 21년 9월 | $0.0015 | $0.0020 |
GPT-4O는 Vision 기능도 지원합니다. Vision 기능 또한 기존의 gpt-4 turbo with Vision 모델에 비해 성능이 향상되었으며, 이용료는 50% 감소했습니다.
Vision 모델의 비용은 이미지의 크기와 해상도에 따라 달라집니다. OpenAI 홈페이지에는 예상 비용을 계산할 수 있는 Vision pricing calculator가 제공됩니다.
파인 튜닝 지원 모델
기본 모델을 파인 튜닝(Fine-tuning)하여 자신의 서비스에 최적화된 맞춤형 모델을 만들 수 있습니다. 요금은 파인 튜닝 과정에서 모델이 실제로 처리한 토큰의 양에 기반하여 청구됩니다.
모델명 | 학습 (1K) | 입력 (1K) | 출력 (1K) |
GPT-3.5-turbo | $0.0080 | $0.0030 | $0.0060 |
Davinci-002 | $0.0060 | $0.0120 | $0.0120 |
Babbage-002 | $0.0004 | $0.0016 | $0.0016 |
현재 GPT-4모델의 파인 튜닝은 자격이 있는 일부 유저에 한정해서 지원됩니다.
어시스턴트 API
어시스턴트 API와 툴(Retrieval, Code interpreter)을 사용하면 개발자가 자신의 애플리케이션 내에서 AI 어시스턴트를 쉽게 구축할 수 있습니다.
어시스턴트 API에 사용되는 토큰은 선택한 언어 모델의 토큰 당 요금으로 청구됩니다.
툴 | 비용 |
Code interpreter | $0.03 / session |
File Search | $0.10 / GB of vector-storage per day (1 GB free) |
🛎️ 제공되는 툴에 대한 설명
Code Interpreter(코드 인터프리터): 코드 인터프리터는 샌드박스 환경에서 Python 코드를 안전하게 작성하고 실행할 수 있는 도구입니다.
사용자는 복잡한 코드 작성과 수학 문제 해결을 위해 반복적인 실행을 할 수 있으며, 그 결과로 그래프와 차트를 생성하거나, 다양한 데이터 형식의 파일을 처리하는 등의 작업을 수행할 수 있습니다.
Retrieval(정보 검색): 정보 검색 기능은 외부 지식, 예를 들어 독점 도메인 데이터, 상세한 제품 정보, 또는 사용자가 제공한 문서 등을 활용하여 어시스턴트의 능력을 확장합니다.
이를 위해 별도로 문서의 임베딩을 계산하고 저장하거나, 청킹과 검색 알고리즘을 개발할 필요가 없습니다. 대신, 어시스턴트 API는 챗GPT의 지식 검색 기능을 구축하는 데 얻은 경험을 기반으로, 가장 효율적인 검색 기술을 결정하고 적용합니다.
Function calling(함수 호출): 어시스턴트가 사용자가 정의한 함수를 호출하고 메시지에 함수 응답을 통합할 수 있습니다.
현재 OpenAI Playground에서 Assistants API를 테스트해 볼 수 있습니다.
이미지 모델
OpenAI 사에서 개발한 AI 이미지 생성 모델 달리3와 달리2를 앱에 직접 빌드하여 앱 내에서 이미지를 생성하고 편집할 수 있습니다.
모델명 | 해상도 | 비용 (이미지 개수) |
DALL·E 3 | 1024×1024 | $0.040 |
1024×1792, 1792×1024 | $0.080 | |
DALL·E 3 HD | 1024x1024 | $0.080 |
1024x1792, 1792x1024 | $0.120 | |
DALL·E 2 | 1024x1024 | $0.020 |
512x512 | $0.018 | |
256x256 | $0.016 |
참고로 2023년 10월 출시된 달리3 모델은 여러 가지 차별화된 강점으로 출시 직후 미드저니와 스테이블 디퓨전이 양분하던 AI 이미지 생성 분야의 판도를 완전히 뒤바꿨습니다.
오디오 모델
Whisper 모델은 음성을 텍스트로 변환하며, 여러 언어를 영어로 번역할 수 있는 기능을 제공합니다. 반면, TTS(Text-To-Speech) 모델은 텍스트를 음성으로 바꾸는 작업을 수행합니다.
모델명 | 비용 |
Whisper | $0.006/minute (가장 가까운 초 단위로 반올림) |
TTS-1 | $0.015 / 1K characters |
TTS-1-HD | $0.030 / 1K characters |
이 문서는 주기적으로 업데이트할 예정입니다. 링크를 보관해 두셨다가 필요시 열어 보실 것을 추천드립니다.