OpenAI a présenté son premier processeur conçu en interne, développé en partenariat avec Broadcom. Nommé Jalapeño, ce circuit est spécifiquement dédié à l’inférence des modèles d’intelligence artificielle.
Le groupe californien a dévoilé ce processeur mercredi 24 juin 2026, conçu et fabriqué en collaboration avec le spécialiste des semi-conducteurs Broadcom. Les modèles d’IA d’OpenAI ont eux-mêmes contribué à la conception de la puce, selon l’entreprise.
Baptisé Jalapeño, le circuit est optimisé pour la phase d’inférence, c’est-à-dire l’exécution de modèles d’IA pré-entraînés en réponse aux commandes des utilisateurs. Les premiers tests montrent une meilleure performance par watt que les alternatives actuelles, affirme OpenAI. Ce processeur cible en priorité les modèles de codage en temps réel. Les tâches plus intensives, comme le pré-entraînement des grands modèles de fondation, devraient continuer de reposer sur les GPU de Nvidia, a précisé l’entreprise.
L’accord de partenariat entre OpenAI et Broadcom avait été officiellement annoncé en octobre 2025. Les rumeurs sur les projets de puces internes d’OpenAI circulaient depuis plusieurs années comme un moyen pour l’entreprise de réduire sa dépendance au fabricant de GPU, qui domine le marché de l’accélération IA avec ses architectures Hopper et Blackwell. L’inférence représente une part croissante des dépenses d’infrastructure des entreprises d’IA, rendant stratégique l’optimisation de cette étape.
Google et Amazon ont déjà développé leurs propres circuits spécialisés pour servir des objectifs similaires : Amazon propose ses puces Trainium et Inferentia, tandis que Google a développé ses Tensor Processing Units (TPU). Microsoft a également dévoilé sa puce Maia, conçue pour ses propres centres de données cloud Azure. Cette course aux accélérateurs IA sur mesure reflète la volonté des grandes entreprises technologiques de réduire leurs coûts et leur dépendance à un fournisseur unique. Le marché mondial des semi-conducteurs pour l’IA est en forte croissance, porté par la demande des centres de données et des applications d’inférence, selon les données de l’industrie rapportées par Bloomberg.
Le président d’OpenAI, Greg Brockman, a expliqué la démarche lors d’un podcast interne après l’annonce du partenariat avec Broadcom : « Nous avons une compréhension profonde de la charge de travail. Nous cherchions des charges spécifiques mal desservies et la façon de construire quelque chose qui accélère ce qui est possible. » Brockman a souligné que cette approche permet à OpenAI d’optimiser l’ensemble de la chaîne technologique, du silicium jusqu’à l’expérience utilisateur.
Dans son annonce, OpenAI a souligné les faibles coûts de fonctionnement de la puce pour l’exécution de modèles de codage en temps réel. Même des réductions modérées des coûts d’inférence peuvent améliorer sensiblement les marges de l’entreprise, selon des analystes cités par Bloomberg et Reuters.
« OpenAI ne développe pas seulement des modèles de pointe ou des produits qui les exploitent », a écrit l’entreprise. « Elle conçoit l’infrastructure qui les sous-tend : architecture des circuits, noyaux logiciels, systèmes de mémoire, réseaux, ordonnancement, déploiement et expérience produit. »
Le processeur Jalapeño est encore en phase de test et aucun calendrier de déploiement commercial n’a été communiqué à ce stade. L’action Broadcom progressait d’environ 3 % à Wall Street après cette annonce, selon les données de marché consultées par Bloomberg et CNBC.
