GTC 2026 : NVIDIA dévoile Vera Rubin et vise 1 000 milliards de dollars de commandes
Jensen Huang a présenté la plateforme Vera Rubin au GTC 2026, une révolution architecturale pour l'IA agentique avec 336 milliards de transistors. NVIDIA vise 1 000 milliards de dollars de commandes d'ici 2027 et prépare déjà l'ère Feynman.
Ce lundi 16 mars 2026, Jensen Huang a pris la scène du SAP Center de San Jose pour livrer l'un des keynotes les plus ambitieux de l'histoire de NVIDIA. Devant une salle comble de développeurs, d'investisseurs et de dirigeants du monde entier, le PDG de NVIDIA a dévoilé la plateforme Vera Rubin — un bond générationnel dans le calcul accéléré — et annoncé qu'il anticipe désormais au moins 1 000 milliards de dollars de commandes pour ses systèmes Blackwell et Vera Rubin d'ici 2027. Bienvenue dans l'ère de l'IA agentique.
Vera Rubin : sept puces, un superordinateur, une révolution
Nommée en hommage à l'astronome Vera Rubin, dont les travaux ont révélé l'existence de la matière noire, la nouvelle plateforme est bien plus qu'un simple GPU. Il s'agit d'une architecture complète composée de sept nouvelles puces, désormais toutes en production complète, conçues pour fonctionner ensemble comme un superordinateur intégré. Le cœur du système, le GPU Rubin R100/R200, est fabriqué par TSMC en gravure 3 nm (procédé N3P) et embarque un nombre vertigineux de 336 milliards de transistors — soit 1,6 fois plus que le Blackwell et ses 208 milliards.
Chaque GPU dispose de 288 Go de mémoire HBM4 avec une bande passante de 22 To/s, et NVIDIA revendique des performances d'inférence atteignant 50 PFLOPS. La configuration Vera Rubin NVL72 permet de connecter jusqu'à 72 GPU en rack, tandis que la variante Vera Rubin Ultra pousse cette limite à 144 GPU, le tout intégré verticalement avec le logiciel pour alimenter les systèmes d'agents IA.
« C'est la puissance incroyable du co-design extrême » — Jensen Huang, PDG de NVIDIA
Le système complet inclut également le CPU Vera, un DPU nouvelle génération, des cartes réseau avancées, l'interconnexion NVLink 6 et une infrastructure de commutation Ethernet. NVIDIA promet une réduction du coût par token d'un facteur 10 par rapport à Blackwell, rendant enfin viable à grande échelle le déploiement d'agents IA capables de chaîner des dizaines d'étapes de raisonnement.
1 000 milliards de dollars : le pari colossal de l'IA agentique
L'an dernier, NVIDIA avait annoncé 500 milliards de dollars de commandes à haute confiance pour Blackwell et Rubin jusqu'en 2026. Jensen Huang a doublé la mise : « Je vois à travers 2027 au moins 1 000 milliards de dollars », a-t-il déclaré sur scène. Le message central du GTC 2026 est que l'IA agentique — ces systèmes capables de raisonner, planifier et exécuter des tâches de manière autonome — provoque un changement fondamental dans les besoins en calcul.
Ce basculement se traduit déjà par des partenariats massifs. NVIDIA et OpenAI ont formalisé un accord stratégique pour déployer 10 gigawatts de systèmes NVIDIA, avec un premier gigawatt prévu au second semestre 2026 sur la plateforme Vera Rubin. Pour soutenir ce déploiement, NVIDIA prévoit d'investir jusqu'à 100 milliards de dollars dans OpenAI de manière progressive.
« L'infrastructure de calcul sera la base de l'économie du futur » — Sam Altman, PDG d'OpenAI
Microsoft déploiera également les systèmes Vera Rubin NVL72 dans ses centres de données IA de nouvelle génération, y compris les futurs sites Fairwater AI superfactory. CoreWeave intégrera les systèmes basés sur Rubin dans sa plateforme cloud IA dès le second semestre 2026. Avec environ 80 % de parts du marché des accélérateurs IA haut de gamme et une capitalisation boursière oscillant entre 4 500 et 5 000 milliards de dollars, NVIDIA a transformé son matériel en standard de facto incontournable.
De l'espace aux robots : NVIDIA repousse toutes les frontières
Jensen Huang n'a pas résisté à l'envie de surprendre. Au-delà des centres de données terrestres, NVIDIA a annoncé Vera Rubin Space-1, un module de calcul conçu pour les centres de données orbitaux. Offrant jusqu'à 25 fois la puissance de calcul IA d'un H100, ce système est adapté aux contraintes de taille, de poids et de puissance de l'espace. Plusieurs entreprises — Aetherflux, Axiom Space, Kepler Communications, Planet Labs — utilisent déjà les technologies NVIDIA pour des opérations spatiales autonomes.
Côté logiciel, NVIDIA a dévoilé NemoClaw, décrit par Huang comme un « système d'exploitation open source pour les ordinateurs agentiques », fruit d'un partenariat avec OpenClaw. Le framework inclut l'application de politiques de sécurité, des garde-fous réseau et une infrastructure de confiance pour le déploiement d'agents IA en entreprise.
L'événement a également mis en lumière DLSS 5, qui combine graphismes 3D traditionnels et IA générative pour le jeu vidéo, ainsi que des démonstrations de robots physiques — dont un robot Olaf de la Reine des Neiges — illustrant les progrès de l'IA physique avec le modèle Groot N1 et la plateforme de conduite autonome Alpamayo.
Feynman : un aperçu de l'ère angström
En regardant au-delà de Vera Rubin, Jensen Huang a levé le voile sur la prochaine architecture majeure : Feynman, prévue pour 2027-2028. Construite sur le procédé TSMC A16 — soit l'ère angström de la gravure — cette architecture pourrait être la première de NVIDIA à remplacer les interconnexions en cuivre par de la photonique silicium, utilisant la lumière pour transmettre les données entre puces. Le nouveau CPU associé s'appellera Rosa, en hommage à Rosalind Franklin, dont les travaux de cristallographie aux rayons X ont révélé la structure de l'ADN.
Pour NVIDIA, la demande d'inférence aurait été multipliée par 100 en un an, à mesure que les boucles agentiques deviennent la norme pour l'automatisation des entreprises. Feynman est la réponse anticipée à cette explosion.
À retenir
- Vera Rubin est une plateforme complète de sept puces en production, avec un GPU de 336 milliards de transistors gravé en 3 nm, promettant 10× les performances par watt de Blackwell.
- Jensen Huang anticipe 1 000 milliards de dollars de commandes pour Blackwell et Vera Rubin d'ici 2027, contre 500 milliards prévus l'an dernier.
- Le partenariat NVIDIA-OpenAI prévoit 10 gigawatts de systèmes et jusqu'à 100 milliards de dollars d'investissement de NVIDIA dans OpenAI.
- Vera Rubin Space-1 marque l'entrée de NVIDIA dans les centres de données orbitaux, avec 25× la puissance d'un H100.
- L'architecture Feynman (2027-2028), gravée en TSMC A16, utilisera la photonique silicium pour les interconnexions.
- L'ère de l'IA agentique — des systèmes autonomes capables de raisonner et d'agir — est le fil conducteur de toutes ces annonces et redéfinit les besoins en infrastructure de calcul.
Photo : Nana Dua via Pexels