GTC 2026 : NVIDIA dévoile Vera Rubin et ouvre l'ère de l'IA agentique
Lors du GTC 2026 à San Jose, Jensen Huang a présenté la plateforme Vera Rubin, dotée de 336 milliards de transistors et capable de 50 PFLOPS par puce. NVIDIA accélère vers l'IA agentique, la conduite autonome et la robotique physique.
Ce lundi 16 mars 2026, le SAP Center de San Jose s'est transformé en épicentre mondial de l'intelligence artificielle. Devant une salle comble, Jensen Huang, le charismatique PDG de NVIDIA, a livré un keynote de deux heures qui pourrait bien marquer un tournant dans l'histoire de l'industrie technologique. Au programme : une nouvelle architecture de puces révolutionnaire, l'avènement de l'IA agentique, des partenariats spectaculaires avec Uber et Disney, et une vision où les agents autonomes deviennent le nouveau paradigme informatique. Bienvenue dans l'ère Rubin.
Vera Rubin : la puce qui redéfinit les superordinateurs
La star incontestée de ce GTC 2026 porte le nom de l'astronome qui a mis en évidence la matière noire : Vera Rubin. Cette nouvelle plateforme constitue une refonte complète de la pile technologique de NVIDIA, fruit d'un travail de « co-design extrême » entre six types de puces : le CPU Vera (basé sur l'architecture ARM), le GPU Rubin, le switch NVLink 6, la SuperNIC ConnectX-9, le processeur de données BlueField-4 et le switch Ethernet Spectrum-6.
Les chiffres donnent le vertige. Le GPU Rubin embarque 336 milliards de transistors répartis sur deux dies, offrant jusqu'à 50 PFLOPS d'inférence en FP4 et 35 PFLOPS d'entraînement par puce — soit respectivement 5x et 3,5x les performances de la génération Blackwell. Chaque GPU dispose de 288 Go de mémoire HBM4 avec une bande passante de 22,2 To/s.
À l'échelle du rack, la configuration phare Vera Rubin NVL72 regroupe 72 GPU Rubin et 36 CPU Vera connectés via NVLink 6. La puissance combinée atteint 3,6 exaFLOPS d'inférence et 2,5 exaFLOPS d'entraînement, avec 20,7 To de mémoire HBM4 et 54 To de mémoire LPDDR5X. NVIDIA promet une réduction du coût par token d'un facteur 10 par rapport à Blackwell, pour un format physique identique permettant une mise à niveau directe.
« Nous avons multiplié la puissance de calcul par 40 millions en dix ans. » — Jensen Huang, keynote GTC 2026
Et NVIDIA ne s'arrête pas là. Le Rubin Ultra, prévu pour le second semestre 2027, intégrera 4 dies de calcul par boîtier pour atteindre 100 PFLOPS en FP4, avec 1 To de mémoire HBM4e. L'architecture suivante, baptisée Feynman, est annoncée pour 2028 sur le procédé TSMC 1,6 nm.
L'ère de l'IA agentique : quand les machines raisonnent et agissent
Au-delà du matériel, Jensen Huang a martelé un message clair : nous entrons dans l'ère de l'IA agentique. Fini les simples modèles de langage qui génèrent du texte sur commande. Les nouveaux systèmes autonomes raisonnent, planifient et agissent dans la durée, sans intervention humaine constante.
Pour concrétiser cette vision, NVIDIA a dévoilé plusieurs initiatives logicielles majeures. D'abord, Nemotron 3 Ultra, présenté comme le meilleur modèle de base au monde, et l'annonce d'une Nemotron Coalition rassemblant des acteurs comme Mistral, Perplexity, Cursor et Black Forest Labs pour développer six familles de modèles frontière en open source.
Ensuite, NemoClaw, né du partenariat entre NVIDIA et le projet viral OpenClaw. Jensen Huang l'a décrit comme un « système d'exploitation open source pour les ordinateurs agentiques ». NemoClaw intègre des mécanismes de sécurité d'entreprise — application de politiques, garde-fous réseau et routage de la confidentialité — pour permettre le déploiement d'agents autonomes sans compromettre les données propriétaires.
« Chaque entreprise dans le monde doit aujourd'hui avoir une stratégie OpenClaw. » — Jensen Huang
Ce virage vers l'IA agentique s'accompagne d'un nouveau composant matériel : un accélérateur d'inférence dédié, spécialement conçu pour la génération de tokens à ultra-faible latence, pièce maîtresse de cette nouvelle économie où la vitesse de raisonnement des agents devient le facteur limitant.
Conduite autonome, robotique et IA physique
La dernière partie du keynote a été consacrée à ce que NVIDIA appelle l'IA physique — des systèmes d'intelligence artificielle capables de naviguer et d'interagir avec le monde réel.
Sur le front de la conduite autonome, Jensen Huang a été catégorique : « Le moment ChatGPT de la conduite autonome est arrivé. » NVIDIA a annoncé quatre nouveaux partenaires constructeurs — BYD, Hyundai, Nissan et Geely — pour sa plateforme de robotaxis, ainsi qu'un partenariat stratégique avec Uber pour intégrer ces véhicules autonomes directement dans son réseau de VTC dans certaines villes.
Côté robotique industrielle, NVIDIA collabore désormais avec ABB, Universal Robots et KUKA pour intégrer ses modèles d'IA physique et ses outils de simulation dans des robots plus intelligents déployés en usine et en entrepôt.
Le moment le plus spectaculaire ? L'entrée sur scène d'un robot Olaf, le personnage de La Reine des Neiges de Disney, marchant et conversant avec Jensen Huang. Ce robot, entraîné dans un environnement de simulation NVIDIA développé conjointement avec Disney, illustre les progrès fulgurants de l'IA physique appliquée au divertissement.
DLSS 5 et le gaming nouvelle génération
Les joueurs n'ont pas été oubliés. NVIDIA a présenté DLSS 5, sa cinquième génération de technologie de super-résolution par intelligence artificielle. Cette version combine les graphismes 3D traditionnels avec l'IA générative pour produire des images photoréalistes en temps réel. Huang a déclaré que DLSS 5 fait « prendre vie aux graphismes informatiques », en utilisant des données structurées pour contrôler la génération de contenu visuel. Une avancée qui brouille encore davantage la frontière entre images calculées et images générées.
Un écosystème qui s'impose comme standard
Ce GTC 2026 confirme la stratégie de NVIDIA : ne pas se contenter de vendre des puces, mais construire un écosystème complet — matériel, logiciel, modèles, services — qui devient le standard de facto de l'industrie de l'IA. Avec un cycle de lancement annuel désormais établi, la concurrence — qu'il s'agisse d'AMD, d'Intel avec Gaudi 3, ou des puces maison de Google et Amazon — peine à suivre le rythme.
Les analystes financiers évoquent déjà une « explosion cambrienne » de services agentiques construits sur la plateforme Rubin, dans des secteurs aussi variés que la santé, le droit et la finance. La cible de déploiement de 5 GW de puissance pour les centres de données illustre l'ampleur de l'infrastructure nécessaire pour alimenter cette nouvelle ère.
À retenir
- Vera Rubin dévoilée : 336 milliards de transistors, 50 PFLOPS par GPU, 288 Go de HBM4 — une rupture technologique majeure avec une production prévue au second semestre 2026.
- L'ère agentique : NVIDIA mise tout sur des agents IA autonomes capables de raisonner et d'agir, avec NemoClaw et la Nemotron Coalition comme piliers logiciels.
- Conduite autonome : partenariats avec BYD, Hyundai, Nissan, Geely et Uber pour déployer des robotaxis à grande échelle.
- IA physique et robotique : collaborations avec ABB, Universal Robots, KUKA et Disney pour des robots intelligents du sol d'usine aux parcs à thèmes.
- Feuille de route agressive : Rubin Ultra (2027) puis Feynman (2028) sur procédé 1,6 nm — NVIDIA impose un rythme annuel que la concurrence peine à suivre.
- DLSS 5 : fusion du rendu 3D et de l'IA générative pour une nouvelle ère graphique.
Photo : Nana Dua via Pexels