NVIDIALa GPU Technology Conference (GTC) de est arrivée !
Le fondateur et PDG de la société, Jensen Huang, a officiellement lancé la conférence annuelle en disant "J'espère que vous réalisez que ce n'est pas un concert, c'est une conférence de développeurs", alors qu'il montait sur scène dans une arène bondée réservée habituellement aux concerts et au hockey sur glace. Jeux.
Au cours du discours d'ouverture, il a dévoilé diverses technologies allant de la plate-forme Blackwell au modèle de base des robots humanoïdes et bien plus encore.
Voici quelques-unes des annonces clés de GTC faites par l'entreprise le premier jour !
La plateforme NVIDIA Blackwell est là !
Lors de la conférence GTC, NVIDIA a annoncé la très médiatisée plate-forme NVIDIA Blackwell pour permettre aux organisations de créer et d'exécuter une IA générative en temps réel sur de grands modèles de langage comportant des milliers de milliards de paramètres, pour un coût et une consommation d'énergie jusqu'à 25 fois inférieurs à ceux de son prédécesseur.
Il est construit avec un processus TSMC 4NP personnalisé et une liaison puce à puce qui connecte deux puces GPU, regroupant 208 milliards de transistors dans un seul GPU.
L'architecture GPU Blackwell comprend six technologies qui accéléreront le traitement des données, la simulation technique, l'automatisation de la conception électronique, la conception de médicaments, quantum l’informatique et l’IA générative.
Parmi les nombreuses organisations qui devraient adopter Blackwell figurent Amazon Web Services, Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla et xAI.
Supercalculateur IA alimenté par Blackwell
NVIDIA a annoncé le NVIDIA DGX SuperPOD, un supercalculateur IA de nouvelle génération alimenté par les superpuces Grace Blackwell de NVIDIA.
Le supercalculateur est conçu pour traiter des modèles comportant des milliards de paramètres avec une disponibilité constante pour les charges de travail d’entraînement et d’inférence d’IA générative à grande échelle.
Le nouveau DGX SuperPOD présente une architecture rack refroidie par liquide, fournissant 11.5 exaflops de puissance de calcul avec une précision FP4 et 240 téraoctets de mémoire rapide. Le système est construit avec les systèmes NVIDIA DGX et peut atteindre des hauteurs encore plus élevées avec des racks supplémentaires.
Chaque système DGX se compose de 36 superpuces NVIDIA, dont 36 processeurs NVIDIA Grace et 72 GPU NVIDIA Blackwell. Ces puces sont interconnectées pour créer un supercalculateur unique via la technologie NVIDIA NVLink de cinquième génération.
Les superpuces GB200 sont capables de fournir des performances jusqu'à 30 fois supérieures à celles du GPU NVIDIA Tensor Core pour les grandes charges de travail d'inférence de modèles de langage.
Plateforme cloud de recherche 6G
NVIDIA a dévoilé une plateforme de recherche 6G qui permet aux chercheurs de développer la prochaine phase de la technologie sans fil.
La plateforme NVIDIA 6G Research Cloud est ouverte, flexible et interconnectée, offrant aux chercheurs une suite complète pour faire progresser l'IA pour la technologie des réseaux d'accès radio (RAN).
La plateforme permet aux organisations d'accélérer le développement de technologies 6G qui connecteront des milliards d'appareils aux infrastructures cloud, jetant ainsi les bases d'un monde hyper-intelligent soutenu par des véhicules autonomes, des espaces intelligents et un large éventail d'expériences de réalité étendue et d'éducation immersive. et les robots collaboratifs.
La plateforme NVIDIA 6G Research Cloud se compose de trois éléments fondamentaux :
- Jumeau numérique NVIDIA Aerial Omniverse pour 6G
- RAN accéléré par CUDA aérien NVIDIA
- Cadre de radio neuronale NVIDIA Sionna
Ansys, Arm, ETH Zurich, Fujitsu, Keysight, Nokia, Northeastern University, Rohde & Schwarz, Samsung, SoftBank Corp. et Viavi sont parmi ses premiers adoptants et ecosystem les partenaires.
Partenariat Google x NVIDIA
Google Cloud et NVIDIA ont teamconçu pour offrir à la communauté du machine learning un accès à une technologie qui accélère sa capacité à créer, faire évoluer et gérer facilement des applications d'IA générative.
Google a annoncé l'adoption de la nouvelle plate-forme informatique NVIDIA Grace Blackwell AI, ainsi que du service NVIDIA DGX Cloud sur Google Cloud.
De plus, la plate-forme DGX Cloud basée sur NVIDIA H100 est désormais généralement disponible sur Google Cloud.
S'appuyant sur leur récente collaboration pour optimiser la famille de modèles ouverts Gemma, Google adoptera également les microservices d'inférence NVIDIA NIM pour fournir aux développeurs une plate-forme ouverte et flexible pour former et déployer à l'aide de leurs outils et frameworks préférés.
Les sociétés ont également annoncé la prise en charge de JAX sur les GPU NVIDIA et les instances Vertex AI alimentées par les GPU NVIDIA H100 et L4 Tensor Core.
Les éléments clés de l’expansion du partenariat comprennent :
- Adoption de NVIDIA Grace Blackwell
- DGX Cloud propulsé par Grace Blackwell arrive sur Google Cloud
- Prise en charge de JAX sur les GPU
- NVIDIA NIM sur Google Kubernetes Engine (GKE)
- Prise en charge de NVIDIA NeMo
- Vertex AI et Dataflow étendent la prise en charge des GPU NVIDIA
Modèle de fondation du projet GR00T
NVIDIA a annoncé le projet GR00T, qui est un modèle de base à usage général destiné aux robots humanoïdes. Le projet vise à réaliser des percées dans le domaine de la robotique et de l’IA incarnée.
Dans le cadre de cette initiative, NVIDIA a également présenté un nouvel ordinateur, Jetson Thor, spécialement conçu pour les robots humanoïdes et basé sur le système sur puce (SoC) NVIDIA Thor.
Jetson Thor a été créé comme une nouvelle plate-forme informatique capable d'effectuer des tâches complexes et d'interagir de manière sûre et naturelle avec les personnes et les machines.
Le System on a Chip (SoC) comprend un nouveau GPU basé sur l'architecture NVIDIA Blackwell. Il est livré avec un moteur de transformateur qui fournit 800 téraflops de performances d'IA à virgule flottante 8 bits et peut gérer des modèles d'IA génératifs multimodaux tels que GR00T.
Il simplifie les efforts de conception et d'intégration grâce à un processeur de sécurité fonctionnelle intégré, un cluster de processeurs hautes performances et 100 Go de bande passante Ethernet.
NVIDIA construit une plate-forme d'IA complète pour les principales sociétés de robots humanoïdes telles que 1X Technologies, Agility Robotics, Apptronik, Boston Dynamics, Figure AI, Fourier Intelligence, Sanctuary AI, Unitree Robotics et XPENG Robotics, entre autres.
En outre, la société a apporté des améliorations significatives à la plate-forme robotique NVIDIA Isaac, qui comprend désormais des modèles de base d'IA générative et des outils pour l'infrastructure de simulation et de flux de travail d'IA.
Les robots propulsés par GR00T, qui signifie Generalist Robot 00 Technology, seront conçus pour comprendre le langage naturel et imiter les mouvements en observant les actions humaines – apprenant rapidement la coordination, la dextérité et d’autres compétences pour naviguer, s’adapter et interagir avec le monde réel.
NVIDIA DRIVE, au service de la prochaine génération de transports
NVIDIA a annoncé que plusieurs grandes entreprises du secteur des transports ont commencé à utiliser les ordinateurs de voiture centralisés NVIDIA DRIVE Thor pour alimenter leurs prochaines flottes grand public et commerciales.
Il comprend des véhicules et des camions à énergie nouvelle, ainsi que des véhicules autonomes tels que des robots-taxis, des robots-bus et des véhicules de livraison du dernier kilomètre.
DRIVE Thor est une plateforme informatique embarquée conçue pour les applications d'IA générative, qui deviennent primordiales dans l'industrie automobile. Cette plate-forme audiovisuelle de nouvelle génération intégrera la nouvelle architecture NVIDIA Blackwell, conçue pour les charges de travail de transformateur, de LLM et d'IA générative.
Microservices d'IA générative pour faire progresser la découverte de médicaments, les technologies médicales et la santé numérique
La société a également lancé plus de deux douzaines de nouveaux microservices permettant aux entreprises de soins de santé derises dans le monde entier pour profiter des dernières avancées en matière d’IA générative depuis n’importe où et sur n’importe quel cloud.
NVIDIA a récemment lancé des microservices de santé optimisés avec des modèles et des flux de travail NIM AI. Ces microservices sont équipés d'API standard du secteur qui peuvent être utilisées pour créer et déployer des applications cloud natives.
Les microservices de santé NVIDIA offrent des fonctionnalités avancées telles que l'imagerie, la reconnaissance du langage naturel et de la parole, ainsi que la génération, la prédiction et la simulation de biologie numérique. Ces fonctionnalités peuvent être utilisées comme éléments de base pour développer et déployer des applications basées sur le cloud pour le secteur de la santé.
De plus, NVIDIA a accéléré software les kits et outils de développement, notamment Parabricks, MONAI, NeMo, Riva et Metropolis, sont désormais accessibles sous forme de microservices NVIDIA CUDA-X pour accélérer les flux de travail des soins de santé pour la découverte de médicaments, l'imagerie médicale et l'analyse génomique.
Au total, 25 microservices ont été lancés pour accélérer la transformation des entreprises de santé grâce à l'utilisation de l'IA générative.
Cette nouvelle technologie offre de nombreuses opportunités aux sociétés pharmaceutiques, aux médecins et aux hôpitaux, telles que le dépistage de milliards de composés médicamenteux pour les progrès médicaux, la collecte de meilleures données sur les patients pour une détection précoce des maladies et la mise en œuvre d'assistants numériques plus intelligents.
Grâce aux microservices, les chercheurs, les développeurs et les praticiens peuvent facilement intégrer l'IA dans des applications nouvelles et existantes, et les exécuter n'importe où, dans le cloud ou sur site, avec des capacités de copilote pour améliorer leur travail qui sauve des vies.
Jumeau numérique du climat terrestre
NVIDIA a présenté sa plate-forme cloud numérique jumelle climatique Earth-2, qui vise à lutter contre les 140 milliards de dollars de pertes économiques causées par les conditions météorologiques extrêmes dues au changement climatique.
La plateforme cloud Earth-2 propose de nouvelles API cloud sur NVIDIA DGX Cloud qui permettent aux utilisateurs de créer des émulations basées sur l'IA et de fournir des simulations interactives et haute résolution de la météo et du climat à une échelle sans précédent, allant de l'atmosphère mondiale à la couverture nuageuse locale.
Lorsqu'elles sont combinées avec des données exclusives appartenant à des entreprises du secteur des technologies climatiques, estimé à 20 milliards de dollars, les API Earth-2 peuvent aider les utilisateurs à fournir des avertissements et des prévisions mises à jour en quelques secondes, par rapport à la modélisation traditionnelle pilotée par le processeur qui peut prendre des minutes ou des heures.
Des commutateurs réseau conçus pour l’IA à grande échelle
NVIDIA a également annoncé une nouvelle vague de commutateurs réseau : la série X800.
Il s'agit de la première plate-forme réseau au monde capable d'un débit de bout en bout de 800 Gb/s, NVIDIA Quantum-X800 InfiniBand et NVIDIA Spectrum-X800 Ethernet repoussent les limites des performances réseau pour les charges de travail informatiques et d'IA.
Ils comportent software qui accélère encore les applications d'IA, de cloud, de traitement de données et HPC dans tous les types de data center, y compris ceux qui intègrent la nouvelle gamme de produits basés sur l'architecture NVIDIA Blackwell.
Il s'agit d'une capacité de bande passante 5 fois supérieure et d'une augmentation de 9 fois de 14.4 Tflops de calcul en réseau avec le protocole d'agrégation et de réduction hiérarchique évolutif (SHARPv4) de NVIDIA par rapport à la génération précédente.
La plate-forme Spectrum-X800 offre des performances réseau optimisées pour le cloud AI et Enterprise Infrastructure. Utilisant le commutateur Spectrum SN5600 800 Gb/s et la SuperNIC NVIDIA BlueField-3, la plate-forme Spectrum-X800 fournit des ensembles de fonctionnalités avancées cruciaux pour les cloud d'IA génératifs multi-locataires et les grandes entreprises.rises.
le cloud Quantum-Microservices de simulation informatique
NVIDIA a également lancé un service cloud qui permet aux chercheurs et aux développeurs de repousser les limites de quantum exploration informatique dans des domaines scientifiques clés, notamment la chimie, la biologie et la science des matériaux.
NVIDIA Quantum Le cloud est basé sur le CUDA-Q open source de l'entreprise quantum plateforme informatique, utilisée par les trois quarts des entreprises déployant quantum unités de traitement, ou QPU.
En tant que microservice, il permet aux utilisateurs, pour la première fois, de créer et de tester de nouveaux systèmes dans le cloud. quantum algorithmes et applications – y compris de puissants simulateurs et outils pour les systèmes hybrides quantum-programmation classique.