Tarification de l’API

Modèles phares

Nos modèles de pointe sont conçus pour passer plus de temps à réfléchir avant de produire une réponse, ce qui les rend idéaux pour les problèmes complexes à plusieurs étapes.

Choisissez un mode de traitement

GPT-5.5

Une nouvelle catégorie d’intelligence pour la programmation et les usages professionnels.

Tarification

Entrée :
5,00 $ US/1 000 000 jetons

Entrée mise en mémoire cache :
0,50 $ US/1 000 000 jetons

Sortie :
30,00 $ US/1 000 000 jetons

GPT-5.4

Un modèle plus abordable pour la programmation et les usages professionnels.

Tarification

Entrée :
2,50 $ US/1 000 000 jetons

Entrée mise en mémoire cache :
0,25 $ US/1 000 000 jetons

Sortie :
15,00 $ US/1 000 000 jetons

GPT-5.4 mini

Notre mini-modèle le plus puissant à ce jour pour la programmation, l’utilisation de l’ordinateur et les sous-agents

Tarification

Entrée :
0,75 $ US/1 000 000 jetons

Entrée mise en mémoire cache :
0,075 $ US/1 000 000 jetons

Sortie :
4,50 $ US/1 000 000 jetons

La tarification ci-dessus reflète les taux de traitement standard pour des longueurs de contexte inférieures à 270K.
En savoir plus sur le traitement par lots⁠(s'ouvre dans une nouvelle fenêtre), la résidence des données et le traitement régional⁠(s'ouvre dans une nouvelle fenêtre)

Explorez la tarification détaillée(s'ouvre dans une nouvelle fenêtre)

Modèles multimodaux

Enrichissez vos applications avec du texte, de l’image et du son grâce à nos modèles conçus pour l’interaction en temps réel et la génération de contenus multimédias.

GPT-Realtime-2

Notre modèle le plus performant pour les interactions vocales en temps réel.

Tarification

Audio :
$32.00 / 1 million de jetons d’entrée
$0.40 / 1 million de jetons d’entrée en cache
$64.00 / 1 million de jetons de sortie

Texte :
$4.00 / 1 million de jetons d’entrée
$0.40 / 1 million de jetons d’entrée en cache
$24.00 / 1 million de jetons de sortie

Image :
$5.00 / 1 million de jetons d’entrée
$0.50 / 1 million de jetons d’entrée en cache

GPT-Realtime-Translate

Un nouveau modèle de traduction en direct qui traduit la parole en temps réel et suit le rythme du locuteur.

Tarification

$0.034 par minute / $0.00057 par seconde

GPT-Realtime-Whisper

Un nouveau service de reconnaissance vocale en continu qui transcrit la parole en temps réel, au fur et à mesure que le locuteur parle.

Tarification

$0.017 par minute / $0.00028 par seconde

GPT-Image-2

Modèle de génération d’images de pointe.

Tarification

Image :
$8.00 / 1 million de jetons d’entrée
$2.00 / 1 million de jetons d'entrée en cache
$30.00 / 1 million de jetons de sortie

Texte :
$5.00 / 1 million de jetons d’entrée
$1.25 / 1 million de jetons d'entrée en cache

Outils

Étendez les capacités de vos modèles avec des outils intégrés pour la récupération, l’exécution et l’accès à des données externes.

Recherche sur le Web

Obtenez des informations à jour depuis le web pour améliorer la pertinence des réponses du modèle.

Tarification

$10.00 /1 000 appels

Les tokens liés au contenu de recherche sont gratuits.

Conteneurs

Exécutez du code et des outils dans des environnements sécurisés et évolutifs, en complément de vos modèles.

Tarification

Maintenant :
1 Go pour $0.03 / 64 Go pour $1.92 par conteneur

À partir du 31 mars 2026
1 Go pour $0.03 / 64 Go pour $1.92 par session de 20 minutes par conteneur

Niveaux de service

Trouvez le bon équilibre entre performances, coûts prévisibles et disponibilité en fonction de vos besoins.

API Batch

Économisez 50 % sur les entrées et sorties grâce à l’API Batch et exécutez des tâches de manière asynchrone sur une période de 24 heures.

Traitement prioritaire

Offre des performances rapides et fiables avec la flexibilité du paiement à l’usage.

Mode Flex

Offre des coûts réduits pour les requêtes en échange de temps de réponse plus lents et d’une indisponibilité occasionnelle des ressources. Idéal pour les tâches hors production ou de moindre priorité.

Offres pour les entreprises

Contactez notre équipe des ventes pour en savoir plus sur la résidence des données⁠(s'ouvre dans une nouvelle fenêtre), l’offre Scale⁠ et la capacité réservée⁠ destinées aux clients à la fine pointe de la technologie qui gèrent des charges de travail plus importantes.

Communiquer avec l'équipe des ventes

FAQ

Nous recommandons aux développeurs d’utiliser nos modèles GPT de grande taille et mini pour les tâches quotidiennes. Nos grands modèles GPT obtiennent généralement de meilleurs résultats sur une grande variété de tâches, tandis que nos modèles GPT mini sont rapides et économiques pour les tâches simples.

Nos modèles de raisonnement grand et mini sont idéaux pour les tâches complexes en plusieurs étapes et les cas d'utilisation STEM qui nécessitent une réflexion approfondie sur des problèmes difficiles. Si vous recherchez une solution plus rapide et économique, vous pouvez choisir le modèle de raisonnement mini.

Nous vous recommandons d'expérimenter tous ces modèles dans le Playground⁠(s'ouvre dans une nouvelle fenêtre) afin d'explorer lesquels offrent le meilleur compromis entre prix et performance pour votre utilisation.

Vous pouvez définir un budget mensuel dans vos paramètres de facturation⁠⁠(s'ouvre dans une nouvelle fenêtre), après quoi nous cesserons de répondre à vos demandes. Il peut y avoir un délai dans l'application de la limite, et vous êtes responsable de tout dépassement encouru. Vous pouvez également configurer un seuil de notification par courriel pour recevoir une alerte par courriel dès que vous dépassez ce seuil chaque mois. Nous vous recommandons de vérifier régulièrement votre tableau de bord de suivi de l'utilisation⁠(s'ouvre dans une nouvelle fenêtre) pour surveiller vos dépenses.

Pour les clients qui gèrent leur travail avec Projects, vous pouvez définir et gérer les restrictions de facturation par projet⁠(s'ouvre dans une nouvelle fenêtre)⁠ dans le tableau de bord.

Les images sont converties en jetons et facturées par jeton. Les modèles textuels évaluent les jetons d'image au tarif standard des jetons textuels, tandis que GPT Image et gpt-realtime utilisent un tarif distinct pour les jetons d'image. Des modèles comme gpt-4.1-mini, gpt-4.1-nano, et o4-mini convertissent les images en jetons de manière différente. Pour en savoir plus, consultez notre documentation.⁠(s'ouvre dans une nouvelle fenêtre)

Outil de calcul des prix

Définir le modèle

Définir la largeur

par

Définir la hauteur

Faible résolution

=0,000263 $ US

Prix pour 1 million de jetons (fixe)	1,25 $ US
Vignettes de 512 × 512	1 × 1
Nombre total de tuiles	1
Jetons de base	70
Jetons de tuile	140 × 1 = 140
Nombre total de jetons	210
Prix total	0,000263 $ US

Commencez à créer avec les modèles puissants d'OpenAI.

Commencer Communiquer avec l'équipe des ventes

Tarification de l’API

Modèles phares

GPT-5.5

Tarification

GPT-5.4

Tarification

GPT-5.4 mini

Tarification

Modèles multimodaux

GPT-Realtime-2

Tarification

GPT-Realtime-Translate

Tarification

GPT-Realtime-Whisper

Tarification

GPT-Image-2

Tarification

Outils

Recherche sur le Web

Tarification

Conteneurs

Tarification

Niveaux de service

API Batch

Traitement prioritaire

Mode Flex

Offres pour les entreprises

FAQ

Quel modèle dois-je utiliser?

Offrez-vous un forfait entreprise ou des SLA?

Mon utilisation de l’API dans le Playground de jeu sera-t-elle facturée?

Comment puis-je connaître le nombre de tokens utilisés tous les mois?

Comment puis-je gérer mes dépenses sur la plateforme API?

L’accès à l’API est-il inclus avec ChatGPT Plus, Business, Enterprise ou Edu?

Comment la tarification des images est-elle calculée?

Commencez à créer avec les modèles puissants d'OpenAI.

Quel modèle dois-je utiliser?

Offrez-vous un forfait entreprise ou des SLA?

Mon utilisation de l’API dans le Playground de jeu sera-t-elle facturée?

Comment puis-je connaître le nombre de tokens utilisés tous les mois?

Comment puis-je gérer mes dépenses sur la plateforme API?

L’accès à l’API est-il inclus avec ChatGPT Plus, Business, Enterprise ou Edu?

Comment la tarification des images est-elle calculée?