GPT-5

Nous présentons GPT-5, notre meilleur système d’IA à ce jour. GPT-5 représente un bond en avant significatif en matière d’intelligence par rapport à tous nos modèles précédents, offrant des performances de pointe dans le codage, les mathématiques, la rédaction, la santé, la perception visuelle, et plus encore. C’est un système unifié qui sait quand répondre rapidement et quand réfléchir plus longuement pour fournir des réponses de niveau expert. GPT-5 est disponible pour tous les utilisateurs, les abonnés Plus bénéficiant d’une utilisation accrue, et les abonnés Pro ayant accès à GPT-5 pro, une version dotée d’un raisonnement étendu pour des réponses encore plus complètes et précises.

Un système unifié

GPT-5 est un système unifié composé d’un modèle intelligent et efficace qui répond à la plupart des questions, d’un modèle de raisonnement plus approfondi (GPT-5 thinking) pour les problèmes plus difficiles, et d’un routeur en temps réel qui décide rapidement lequel utiliser en fonction du type de conversation, de la complexité, des besoins en outils et de votre intention explicite (par exemple, si vous dites « réfléchis bien à cela » dans l’invite). Le routeur est entraîné en continu sur des signaux réels, y compris lorsque les utilisateurs changent de modèle, les taux de préférence pour les réponses et l’exactitude mesurée, s’améliorant ainsi avec le temps. Une fois les limites d’utilisation atteintes, une version mini de chaque modèle traite les requêtes restantes. Dans un avenir proche, nous prévoyons d’intégrer ces capacités dans un modèle unique.

Un modèle plus intelligent et plus largement utile

GPT-5 non seulement surpasse les modèles précédents dans les tests de référence et répond plus rapidement aux questions, mais surtout, il est plus utile pour les requêtes du monde réel. Nous avons réalisé des progrès significatifs dans la réduction des hallucinations, l’amélioration du suivi des instructions et la minimisation de la sycophanie, tout en augmentant les performances de GPT-5 dans trois des utilisations les plus courantes de ChatGPT : la rédaction, le codage et la santé.

Codage

GPT-5 est notre modèle de codage le plus puissant à ce jour. Il montre des améliorations particulières dans la génération front-end complexe et le débogage de dépôts plus volumineux. Il peut souvent créer de magnifiques sites web, applications et jeux réactifs avec un sens de l’esthétique en une seule invite, transformant intuitivement et avec goût les idées en réalité. Les premiers testeurs ont également noté ses choix de conception, avec une bien meilleure compréhension de l’espacement, de la typographie et de l’espace blanc.

Expression créative et rédaction

GPT-5 est notre collaborateur d’écriture le plus capable à ce jour, capable de vous aider à diriger et traduire des idées brutes en une écriture convaincante et percutante avec une profondeur littéraire et un rythme. Il gère de manière plus fiable l’écriture impliquant une ambiguïté structurelle, comme le maintien d’un pentamètre iambique non rimé ou d’un vers libre qui coule naturellement, combinant le respect de la forme avec la clarté expressive. Ces capacités d’écriture améliorées signifient que ChatGPT est meilleur pour vous aider dans les tâches quotidiennes comme la rédaction et l’édition de rapports, d’e-mails, de mémos, et plus encore.

Santé

GPT-5 est notre meilleur modèle à ce jour pour les questions liées à la santé, permettant aux utilisateurs de s’informer et de défendre leur santé. Le modèle obtient des scores significativement plus élevés que tout modèle précédent sur HealthBench⁠, une évaluation que nous avons publiée plus tôt cette année basée sur des scénarios réalistes et des critères définis par des médecins. Comparé aux modèles précédents, il agit davantage comme un partenaire de réflexion actif, signalant pro-activement les préoccupations potentielles et posant des questions pour donner des réponses plus utiles. Le modèle fournit également désormais des réponses plus précises et fiables, s’adaptant au contexte, au niveau de connaissance et à la géographie de l’utilisateur, ce qui lui permet de fournir des réponses plus sûres et plus utiles dans un large éventail de scénarios. Il est important de noter que ChatGPT ne remplace pas un professionnel de la santé — considérez-le comme un partenaire pour vous aider à comprendre les résultats, à poser les bonnes questions pendant le temps dont vous disposez avec les prestataires de soins, et à peser les options lors de la prise de décisions.

GPT-5 est bien plus intelligent sur tous les plans, comme en témoignent ses performances sur les benchmarks académiques et évalués par l’homme, en particulier en mathématiques, codage, perception visuelle et santé. Il établit une nouvelle référence de pointe en mathématiques (94,6 % sur AIME 2025 sans outils), en codage en conditions réelles (74,9 % sur SWE-bench Verified, 88 % sur Aider Polyglot), en compréhension multimodale (84,2 % sur MMMU) et en santé (46,2 % sur HealthBench Hard) — et ces gains se manifestent dans l’utilisation quotidienne. Avec le raisonnement étendu de GPT-5 pro, le modèle établit également un nouveau SOTA sur GPQA, obtenant 88,4 % sans outils.

Multimodalité

Le modèle excelle dans une gamme de benchmarks multimodaux, couvrant le raisonnement visuel, basé sur la vidéo, spatial et scientifique. Des performances multimodales plus fortes signifient que ChatGPT peut raisonner plus précisément sur des images et d’autres entrées non textuelles, qu’il s’agisse d’interpréter un graphique, de résumer une photo d’une présentation ou de répondre à des questions sur un diagramme.

GPT-5 a été entraîné sur les supercalculateurs IA de Microsoft Azure.

Construire un modèle plus robuste, fiable et utile

GPT-5 est nettement moins susceptible de produire des hallucinations que nos modèles précédents. Avec la recherche web activée sur des invites anonymisées représentatives du trafic de production de ChatGPT, les réponses de GPT-5 sont environ 45 % moins susceptibles de contenir une erreur factuelle que celles de GPT-4o, et lors de la réflexion, les réponses de GPT-5 sont environ 80 % moins susceptibles de contenir une erreur factuelle que celles d’OpenAI o3. Nous avons particulièrement investi pour rendre nos modèles plus fiables lors du raisonnement sur des questions complexes et ouvertes. Par conséquent, nous avons ajouté de nouvelles évaluations pour tester la factualité ouverte. Nous avons mesuré le taux d’hallucination de GPT-5 lors de la réflexion sur des invites ouvertes de recherche factuelle provenant de deux benchmarks de factualité publics : LongFact (concepts et objets) et FActScore. Sur l’ensemble de ces benchmarks, « GPT-5 thinking » montre une forte baisse des hallucinations — environ six fois moins que o3 — marquant un net progrès dans la production de contenu long format constamment précis.

Outre une factualité améliorée, GPT-5 (avec réflexion) communique plus honnêtement ses actions et ses capacités à l’utilisateur, en particulier pour les tâches impossibles, sous-spécifiées ou manquant d’outils clés. Afin d’obtenir une récompense élevée pendant l’entraînement, les modèles de raisonnement peuvent apprendre à mentir sur la réussite d’une tâche ou à être trop confiants quant à une réponse incertaine. Par exemple, pour tester cela, nous avons supprimé toutes les images des invites du benchmark multimodal CharXiv, et avons constaté qu’OpenAI o3 donnait encore des réponses confiantes sur des images inexistantes dans 86,7 % des cas, contre seulement 9 % pour GPT-5. Lorsqu’il raisonne, GPT-5 reconnaît plus précisément quand les tâches ne peuvent pas être accomplies et communique clairement ses limites. Nous avons évalué les taux de tromperie sur des scénarios impliquant des tâches de codage impossibles et des ressources multimodales manquantes, et avons constaté que GPT-5 (avec réflexion) est moins trompeur que o3 sur l’ensemble des scénarios. Sur un large ensemble de conversations représentatives du trafic de production réel de ChatGPT, nous avons réduit les taux de tromperie de 4,8 % pour o3 à 2,1 % des réponses de raisonnement de GPT-5. Bien que cela représente une amélioration significative pour les utilisateurs, il reste du travail à faire, et nous poursuivons nos recherches pour améliorer la factualité et l’honnêteté de nos modèles.

GPT-5 est nettement meilleur pour suivre les instructions, et nous constatons une amélioration correspondante dans sa capacité à suivre les instructions personnalisées. Nous lançons également un aperçu de recherche de quatre nouvelles personnalités prédéfinies pour tous les utilisateurs de ChatGPT, rendues possibles par les améliorations de l’orientabilité. Ces personnalités, disponibles initialement pour le chat textuel et plus tard pour la Voix, vous permettent de définir comment ChatGPT interagit — que ce soit de manière concise et professionnelle, réfléchie et solidaire, ou un peu sarcastique — sans écrire d’invites personnalisées. Les quatre options initiales, Cynique, Robot, Auditeur et Nerd, sont optionnelles, ajustables à tout moment dans les paramètres, et conçues pour correspondre à votre style de communication. Toutes ces nouvelles personnalités respectent ou dépassent notre barre lors des évaluations internes pour la réduction de la sycophanie. Nous sommes impatients d’apprendre et d’itérer en fonction des premiers retours.

Garanties complètes contre les risques biologiques

Nous avons décidé de traiter le modèle « GPT-5 thinking » comme ayant une Haute capacité dans le domaine biologique et chimique, et avons mis en œuvre des garanties solides pour minimiser suffisamment les risques associés. Nous avons rigoureusement testé le modèle avec nos évaluations de sécurité dans le cadre de notre [Cadre de préparation], en effectuant 5 000 heures de tests contradictoires (red teaming) avec des partenaires tels que le CAISI et l’UK AISI. Similaire à notre approche pour l’Agent ChatGPT, bien que nous n’ayons pas de preuve définitive que ce modèle pourrait aider de manière significative un novice à créer un préjudice biologique grave – notre seuil défini pour la Haute capacité – nous adoptons une approche de précaution et activons les garanties requises dès maintenant afin d’accroître la préparation pour le moment où de telles capacités seront disponibles. En conséquence, « GPT-5 thinking » dispose d’un empilement de sécurité robuste avec un système de défense multicouche pour la biologie : modélisation complète des menaces, entraînement du modèle à ne pas produire de contenu nuisible grâce à notre nouveau paradigme de finalisations sûres, classificateurs et moniteurs de raisonnement toujours actifs, et pipelines d’application clairs. En savoir plus sur notre approche de sécurité robuste pour GPT-5 dans notre [fiche système].

GPT-5 pro

Pour les tâches les plus difficiles et complexes, nous lançons également GPT-5 pro, remplaçant OpenAI o3-pro, une variante de GPT-5 qui réfléchit encore plus longtemps, en utilisant un calcul parallèle au moment du test, à grande échelle mais efficace, pour fournir les réponses les plus complètes et de la plus haute qualité. GPT-5 pro atteint les performances les plus élevées de la famille GPT-5 sur plusieurs benchmarks d’intelligence difficiles, y compris des performances de pointe sur GPQA, qui contient des questions scientifiques extrêmement difficiles. Lors d’évaluations sur plus de 1000 invites de raisonnement du monde réel ayant une valeur économique, des experts externes ont préféré GPT-5 pro à « GPT-5 thinking » 67,8 % du temps. GPT-5 pro a commis 22 % d’erreurs majeures en moins et a excellé dans les domaines de la santé, des sciences, des mathématiques et du codage. Les experts ont évalué ses réponses comme pertinentes, utiles et complètes.

Comment utiliser GPT-5

GPT-5 est le nouveau modèle par défaut dans ChatGPT, remplaçant GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 et GPT-4.5 pour les utilisateurs connectés. Ouvrez simplement ChatGPT et tapez votre question ; GPT-5 gère le reste, appliquant le raisonnement automatiquement lorsque la réponse en bénéficierait. Les utilisateurs payants peuvent toujours sélectionner « GPT-5 Thinking » dans le sélecteur de modèle, ou taper quelque chose comme « réfléchis bien à cela » dans l’invite pour s’assurer que le raisonnement est utilisé lors de la génération d’une réponse.

Disponibilité et accès

GPT-5 commence à être déployé aujourd’hui pour tous les utilisateurs Plus, Pro, Team et Free, l’accès pour Enterprise et Edu arrivant la semaine prochaine. Les utilisateurs Pro, Plus et Team peuvent également commencer à coder avec GPT-5 dans le Codex CLI en se connectant avec ChatGPT. Comme pour GPT-4o, la différence entre l’accès gratuit et payant à GPT-5 est le volume d’utilisation. Les abonnés Pro bénéficient d’un accès illimité à GPT-5 et d’un accès à GPT-5 Pro. Les utilisateurs Plus peuvent l’utiliser confortablement comme modèle par défaut pour les questions quotidiennes, avec une utilisation nettement supérieure à celle des utilisateurs gratuits. Les clients Team, Enterprise et Edu peuvent également utiliser GPT-5 confortablement comme modèle par défaut pour le travail quotidien, avec des limites généreuses qui permettent aux organisations entières de s’appuyer facilement sur GPT-5. Pour les utilisateurs gratuits de ChatGPT, le déploiement complet des capacités de raisonnement peut prendre quelques jours. Une fois que les utilisateurs gratuits atteignent leurs limites d’utilisation de GPT-5, ils passeront à GPT-5 mini, un modèle plus petit, plus rapide et très performant.

Retour en haut