Tarification de l’API
Modèles phares
Nos modèles de pointe sont conçus pour passer plus de temps à réfléchir avant de produire une réponse, ce qui les rend idéaux pour les problèmes complexes à plusieurs étapes.
GPT-5.5
Une nouvelle catégorie d’intelligence pour la programmation et les usages professionnels.
Tarification
5,00 $ US/1 000 000 jetons
0,50 $ US/1 000 000 jetons
30,00 $ US/1 000 000 jetons
GPT-5.4
Un modèle plus abordable pour la programmation et les usages professionnels.
Tarification
2,50 $ US/1 000 000 jetons
0,25 $ US/1 000 000 jetons
15,00 $ US/1 000 000 jetons
GPT-5.4 mini
Notre mini-modèle le plus puissant à ce jour pour la programmation, l’utilisation de l’ordinateur et les sous-agents
Tarification
0,75 $ US/1 000 000 jetons
0,075 $ US/1 000 000 jetons
4,50 $ US/1 000 000 jetons
La tarification ci-dessus reflète les taux de traitement standard pour des longueurs de contexte inférieures à 270K.
En savoir plus sur le traitement par lots(s'ouvre dans une nouvelle fenêtre), la résidence des données et le traitement régional(s'ouvre dans une nouvelle fenêtre)
Modèles multimodaux
Enrichissez vos applications avec du texte, de l’image et du son grâce à nos modèles conçus pour l’interaction en temps réel et la génération de contenus multimédias.
GPT-Realtime-2
Notre modèle le plus performant pour les interactions vocales en temps réel.
Tarification
Audio :
$32.00 / 1 million de jetons d’entrée
$0.40 / 1 million de jetons d’entrée en cache
$64.00 / 1 million de jetons de sortie
Texte :
$4.00 / 1 million de jetons d’entrée
$0.40 / 1 million de jetons d’entrée en cache
$24.00 / 1 million de jetons de sortie
Image :
$5.00 / 1 million de jetons d’entrée
$0.50 / 1 million de jetons d’entrée en cache
GPT-Realtime-Translate
Un nouveau modèle de traduction en direct qui traduit la parole en temps réel et suit le rythme du locuteur.
Tarification
$0.034 par minute / $0.00057 par seconde
GPT-Realtime-Whisper
Un nouveau service de reconnaissance vocale en continu qui transcrit la parole en temps réel, au fur et à mesure que le locuteur parle.
Tarification
$0.017 par minute / $0.00028 par seconde
GPT-Image-2
Modèle de génération d’images de pointe.
Tarification
Image :
$8.00 / 1 million de jetons d’entrée
$2.00 / 1 million de jetons d'entrée en cache
$30.00 / 1 million de jetons de sortie
Texte :
$5.00 / 1 million de jetons d’entrée
$1.25 / 1 million de jetons d'entrée en cache
Outils
Étendez les capacités de vos modèles avec des outils intégrés pour la récupération, l’exécution et l’accès à des données externes.
Recherche sur le Web
Obtenez des informations à jour depuis le web pour améliorer la pertinence des réponses du modèle.
Tarification
$10.00 /1 000 appels
Les tokens liés au contenu de recherche sont gratuits.
Conteneurs
Exécutez du code et des outils dans des environnements sécurisés et évolutifs, en complément de vos modèles.
Tarification
Maintenant :
1 Go pour $0.03 / 64 Go pour $1.92 par conteneur
À partir du 31 mars 2026
1 Go pour $0.03 / 64 Go pour $1.92 par session de 20 minutes par conteneur
Niveaux de service
Trouvez le bon équilibre entre performances, coûts prévisibles et disponibilité en fonction de vos besoins.
API Batch
Économisez 50 % sur les entrées et sorties grâce à l’API Batch et exécutez des tâches de manière asynchrone sur une période de 24 heures.
Traitement prioritaire
Offre des performances rapides et fiables avec la flexibilité du paiement à l’usage.
Mode Flex
Offre des coûts réduits pour les requêtes en échange de temps de réponse plus lents et d’une indisponibilité occasionnelle des ressources. Idéal pour les tâches hors production ou de moindre priorité.
Offres pour les entreprises
Contactez notre équipe des ventes pour en savoir plus sur la résidence des données(s'ouvre dans une nouvelle fenêtre), l’offre Scale et la capacité réservée destinées aux clients à la fine pointe de la technologie qui gèrent des charges de travail plus importantes.