Passer au contenu principal
OpenAI

Modèles phares

Nos modèles de pointe sont conçus pour passer plus de temps à réfléchir avant de produire une réponse, ce qui les rend idéaux pour les problèmes complexes à plusieurs étapes.

Choisissez un mode de traitement

GPT-5.5

Une nouvelle catégorie d’intelligence pour la programmation et les usages professionnels.

Tarification

Entrée :
5,00 $ US/1 000 000 jetons
Entrée mise en mémoire cache :
0,50 $ US/1 000 000 jetons
Sortie :
30,00 $ US/1 000 000 jetons

GPT-5.4

Un modèle plus abordable pour la programmation et les usages professionnels.

Tarification

Entrée :
2,50 $ US/1 000 000 jetons
Entrée mise en mémoire cache :
0,25 $ US/1 000 000 jetons
Sortie :
15,00 $ US/1 000 000 jetons

GPT-5.4 mini

Notre mini-modèle le plus puissant à ce jour pour la programmation, l’utilisation de l’ordinateur et les sous-agents

Tarification

Entrée :
0,75 $ US/1 000 000 jetons
Entrée mise en mémoire cache :
0,075 $ US/1 000 000 jetons
Sortie :
4,50 $ US/1 000 000 jetons

La tarification ci-dessus reflète les taux de traitement standard pour des longueurs de contexte inférieures à 270K.
En savoir plus sur le traitement par lots(s'ouvre dans une nouvelle fenêtre), la résidence des données et le traitement régional(s'ouvre dans une nouvelle fenêtre)

Modèles multimodaux

Enrichissez vos applications avec du texte, de l’image et du son grâce à nos modèles conçus pour l’interaction en temps réel et la génération de contenus multimédias.

GPT-Realtime-2

Notre modèle le plus performant pour les interactions vocales en temps réel.

Tarification

Audio :
$32.00 / 1 million de jetons d’entrée
$0.40 / 1 million de jetons d’entrée en cache
$64.00 / 1 million de jetons de sortie

Texte :
$4.00 / 1 million de jetons d’entrée
$0.40 / 1 million de jetons d’entrée en cache
$24.00 / 1 million de jetons de sortie

Image :
$5.00 / 1 million de jetons d’entrée
$0.50 / 1 million de jetons d’entrée en cache

GPT-Realtime-Translate

Un nouveau modèle de traduction en direct qui traduit la parole en temps réel et suit le rythme du locuteur.

Tarification

$0.034 par minute / $0.00057 par seconde

GPT-Realtime-Whisper

Un nouveau service de reconnaissance vocale en continu qui transcrit la parole en temps réel, au fur et à mesure que le locuteur parle.

Tarification

$0.017 par minute / $0.00028 par seconde

GPT-Image-2

Modèle de génération d’images de pointe.

Tarification

Image :
$8.00 / 1 million de jetons d’entrée
$2.00 / 1 million de jetons d'entrée en cache
$30.00 / 1 million de jetons de sortie

Texte :
$5.00 / 1 million de jetons d’entrée
$1.25 / 1 million de jetons d'entrée en cache

Outils

Étendez les capacités de vos modèles avec des outils intégrés pour la récupération, l’exécution et l’accès à des données externes.

Recherche sur le Web

Obtenez des informations à jour depuis le web pour améliorer la pertinence des réponses du modèle.

Tarification

$10.00 /1 000 appels

Les tokens liés au contenu de recherche sont gratuits.

Conteneurs

Exécutez du code et des outils dans des environnements sécurisés et évolutifs, en complément de vos modèles.

Tarification

Maintenant :
1 Go pour $0.03 / 64 Go pour $1.92 par conteneur

À partir du 31 mars 2026
1 Go pour $0.03 / 64 Go pour $1.92 par session de 20 minutes par conteneur

Niveaux de service

Trouvez le bon équilibre entre performances, coûts prévisibles et disponibilité en fonction de vos besoins.

Icône de pile

API Batch

Économisez 50 % sur les entrées et sorties grâce à l’API Batch et exécutez des tâches de manière asynchrone sur une période de 24 heures.

Icône de minuteur

Traitement prioritaire

Offre des performances rapides et fiables avec la flexibilité du paiement à l’usage.

Icône de flèche vers le haut et vers le bas

Mode Flex

Offre des coûts réduits pour les requêtes en échange de temps de réponse plus lents et d’une indisponibilité occasionnelle des ressources. Idéal pour les tâches hors production ou de moindre priorité.

Offres pour les entreprises

Contactez notre équipe des ventes pour en savoir plus sur la résidence des données(s'ouvre dans une nouvelle fenêtre), l’offre Scale et la capacité réservée destinées aux clients à la fine pointe de la technologie qui gèrent des charges de travail plus importantes.

FAQ

Commencez à créer avec les modèles puissants d'OpenAI.