NVIDIA¡La Conferencia de Tecnología GPU (GTC) ya está aquí!
El fundador y director ejecutivo de la compañía, Jensen Huang, inauguró oficialmente la conferencia anual diciendo: "Espero que sepan que esto no es un concierto, es una conferencia de desarrolladores", mientras subía al escenario en un estadio lleno de gente reservado generalmente para conciertos y hockey sobre hielo. juegos.
Durante el discurso de apertura, dio a conocer varias tecnologías que van desde la plataforma Blackwell hasta el modelo básico para robots humanoides y mucho más.
¡Estos son algunos de los anuncios clave de GTC realizados por la compañía el primer día!
¡La plataforma NVIDIA Blackwell ya está aquí!
En la Conferencia GTC, NVIDIA anunció la muy publicitada plataforma NVIDIA Blackwell para permitir a las organizaciones construir y ejecutar IA generativa en tiempo real en modelos de lenguaje de gran tamaño con billones de parámetros a un costo y consumo de energía hasta 25 veces menor que su predecesor.
Está construido con un proceso 4NP TSMC personalizado y un enlace de chip a chip que conecta dos matrices de GPU, empaquetando 208 mil millones de transistores en una sola GPU.
La arquitectura Blackwell GPU presenta seis tecnologías que acelerarán el procesamiento de datos, la simulación de ingeniería, la automatización del diseño electrónico, el diseño de fármacos, quantum informática e IA generativa.
Entre las muchas organizaciones que se espera que adopten Blackwell se encuentran Amazon Web Services, Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla y xAI.
Supercomputadora de IA impulsada por Blackwell
NVIDIA ha anunciado NVIDIA DGX SuperPOD, una supercomputadora de inteligencia artificial de próxima generación impulsada por los superchips Grace Blackwell de NVIDIA.
La supercomputadora está diseñada para procesar modelos de billones de parámetros con tiempo de actividad constante para cargas de trabajo de inferencia y entrenamiento de IA generativa a gran escala.
El nuevo DGX SuperPOD presenta una arquitectura a escala de rack refrigerada por líquido, que proporciona 11.5 exaflops de potencia de supercomputación con precisión FP4 y 240 terabytes de memoria rápida. El sistema está construido con sistemas NVIDIA DGX y puede escalar a alturas aún mayores con bastidores adicionales.
Cada sistema DGX consta de 36 Superchips NVIDIA, que incluyen 36 CPU NVIDIA Grace y 72 GPU NVIDIA Blackwell. Estos chips están interconectados para crear una única supercomputadora mediante la tecnología NVIDIA NVLink de quinta generación.
Los Superchips GB200 son capaces de ofrecer un aumento de rendimiento de hasta 30 veces en comparación con la GPU NVIDIA Tensor Core para cargas de trabajo de inferencia de modelos de lenguaje de gran tamaño.
Plataforma en la nube de investigación 6G
NVIDIA presentó una plataforma de investigación 6G que permite a los investigadores desarrollar la siguiente fase de la tecnología inalámbrica.
La plataforma NVIDIA 6G Research Cloud es abierta, flexible e interconectada y ofrece a los investigadores un conjunto completo para avanzar en la tecnología de IA para redes de acceso por radio (RAN).
La plataforma permite a las organizaciones acelerar el desarrollo de tecnologías 6G que conectarán billones de dispositivos con infraestructuras en la nube, sentando las bases para un mundo hiperinteligente respaldado por vehículos autónomos, espacios inteligentes y una amplia gama de realidad extendida y experiencias educativas inmersivas. y robots colaborativos.
La plataforma NVIDIA 6G Research Cloud consta de tres elementos fundamentales:
- Gemelo digital NVIDIA Aerial Omniverse para 6G
- RAN aérea acelerada por CUDA de NVIDIA
- Marco de radio neuronal NVIDIA Sionna
Ansys, Arm, ETH Zurich, Fujitsu, Keysight, Nokia, Northeastern University, Rohde & Schwarz, Samsung, SoftBank Corp. y Viavi se encuentran entre los primeros en adoptar y ecosystem fogonadura.
Asociación entre Google y NVIDIA
Google Cloud y NVIDIA tienen teamse creó para ofrecer a la comunidad de aprendizaje automático acceso a tecnología que acelera su capacidad para construir, escalar y administrar fácilmente aplicaciones de IA generativa.
Google anunció la adopción de la nueva plataforma informática NVIDIA Grace Blackwell AI, así como el servicio NVIDIA DGX Cloud en Google Cloud.
Además, la plataforma DGX Cloud con tecnología NVIDIA H100 ahora está disponible de forma generalizada en Google Cloud.
Aprovechando su reciente colaboración para optimizar la familia Gemma de modelos abiertos, Google también adoptará los microservicios de inferencia NIM de NVIDIA para proporcionar a los desarrolladores una plataforma abierta y flexible para entrenar e implementar utilizando sus herramientas y marcos preferidos.
Las compañías también anunciaron soporte para JAX en GPU NVIDIA e instancias Vertex AI con tecnología de GPU NVIDIA H100 y L4 Tensor Core.
Los componentes clave de la expansión de la asociación incluyen:
- Adopción de NVIDIA Grace Blackwell
- DGX Cloud con tecnología de Grace Blackwell llega a Google Cloud
- Soporte para JAX en GPU
- NIM de NVIDIA en Google Kubernetes Engine (GKE)
- Soporte para NVIDIA NeMo
- Vertex AI y Dataflow amplían el soporte para las GPU NVIDIA
Proyecto GR00T Modelo de Cimentación
NVIDIA ha anunciado el Proyecto GR00T, que es un modelo de base de uso general destinado a robots humanoides. El proyecto tiene como objetivo impulsar avances en robótica e inteligencia artificial incorporada.
Como parte de esta iniciativa, NVIDIA también ha presentado una nueva computadora, Jetson Thor, que está diseñada específicamente para robots humanoides y se basa en el sistema en chip (SoC) NVIDIA Thor.
Jetson Thor fue creado como una nueva plataforma informática capaz de realizar tareas complejas e interactuar de forma segura y natural con personas y máquinas.
El System on a Chip (SoC) incluye una nueva GPU basada en la arquitectura NVIDIA Blackwell. Viene con un motor transformador que proporciona 800 teraflops de rendimiento de IA de punto flotante de 8 bits y puede manejar modelos de IA generativa multimodal como el GR00T.
Simplifica los esfuerzos de diseño e integración con un procesador de seguridad funcional integrado, un clúster de CPU de alto rendimiento y 100 GB de ancho de banda Ethernet.
NVIDIA está construyendo una plataforma integral de IA para empresas líderes en robots humanoides, como 1X Technologies, Agility Robotics, Apptronik, Boston Dynamics, Figure AI, Fourier Intelligence, Sanctuary AI, Unitree Robotics y XPENG Robotics, entre otras.
Además, la compañía ha realizado importantes actualizaciones en la plataforma de robótica NVIDIA Isaac, que ahora incluye modelos básicos de IA generativa y herramientas para simulación e infraestructura de flujo de trabajo de IA.
Los robots impulsados por GR00T, que significa Tecnología Generalista Robot 00, estarán diseñados para comprender el lenguaje natural y emular movimientos mediante la observación de acciones humanas, aprendiendo rápidamente coordinación, destreza y otras habilidades para navegar, adaptarse e interactuar con el mundo real.
NVIDIA DRIVE, impulsando la próxima generación de transporte
NVIDIA ha anunciado que varias empresas importantes de la industria del transporte han comenzado a utilizar las computadoras centralizadas para automóviles NVIDIA DRIVE Thor para alimentar sus próximas flotas comerciales y de consumo.
Incluye vehículos y camiones de nueva energía, así como vehículos autónomos como robotaxis, robobuses y vehículos de reparto de última milla.
DRIVE Thor es una plataforma informática para vehículos diseñada para aplicaciones de IA generativa, que se están volviendo primordiales en la industria automotriz. Esta plataforma AV de próxima generación integrará la nueva arquitectura NVIDIA Blackwell, diseñada para cargas de trabajo de transformadores, LLM e IA generativa.
Microservicios de IA generativa para avanzar en el descubrimiento de fármacos, la tecnología médica y la salud digital
La compañía también lanzó más de dos docenas de nuevos microservicios que permiten a las empresas de atención médicarises en todo el mundo para aprovechar los últimos avances en IA generativa desde cualquier lugar y en cualquier nube.
NVIDIA lanzó recientemente microservicios de atención médica que se han optimizado con modelos y flujos de trabajo de NIM AI. Estos microservicios están equipados con API estándar de la industria que se pueden utilizar para crear e implementar aplicaciones nativas de la nube.
Los microservicios de atención médica de NVIDIA ofrecen funciones avanzadas como imágenes, lenguaje natural y reconocimiento de voz, y generación, predicción y simulación de biología digital. Estas características se pueden utilizar como componentes básicos para desarrollar e implementar aplicaciones basadas en la nube para la industria de la salud.
Además, NVIDIA aceleró software Ahora se puede acceder a kits y herramientas de desarrollo, incluidos Parabricks, MONAI, NeMo, Riva y Metropolis, como microservicios NVIDIA CUDA-X para acelerar los flujos de trabajo de atención médica para el descubrimiento de fármacos, imágenes médicas y análisis genómicos.
En total, se lanzaron 25 microservicios para acelerar la transformación de las empresas de atención médica mediante el uso de IA generativa.
Esta nueva tecnología ofrece numerosas oportunidades para las empresas farmacéuticas, los médicos y los hospitales, como la detección de billones de compuestos farmacológicos en busca de avances médicos, la recopilación de mejores datos de los pacientes para la detección temprana de enfermedades y la implementación de asistentes digitales más inteligentes.
Con los microservicios, los investigadores, desarrolladores y profesionales pueden integrar fácilmente la IA en aplicaciones nuevas y existentes, y ejecutarlas en cualquier lugar, ya sea en la nube o en las instalaciones, con capacidades de copiloto para mejorar su trabajo que salva vidas.
Gemelo digital del clima terrestre
NVIDIA ha presentado su plataforma de nube gemela digital climática Earth-2, cuyo objetivo es combatir los 140 mil millones de dólares en pérdidas económicas causadas por el clima extremo debido al cambio climático.
La plataforma en la nube Earth-2 presenta nuevas API en la nube en NVIDIA DGX Cloud que permiten a los usuarios crear emulaciones impulsadas por IA y ofrecer simulaciones interactivas de alta resolución del tiempo y el clima a una escala sin precedentes, que van desde la atmósfera global hasta la cobertura de nubes local.
Cuando se combinan con datos patentados de empresas de la industria de la tecnología climática de 20 mil millones de dólares, las API de Earth-2 pueden ayudar a los usuarios a entregar advertencias y pronósticos actualizados en segundos, en comparación con el modelado tradicional impulsado por CPU que puede tardar minutos u horas.
Conmutadores de red diseñados para IA a gran escala
NVIDIA también anunció una nueva ola de conmutadores de red: la serie X800.
Es la primera plataforma de red del mundo capaz de ofrecer un rendimiento de extremo a extremo de 800 Gb/s, NVIDIA Quantum-X800 InfiniBand y NVIDIA Spectrum-X800 Ethernet amplían los límites del rendimiento de redes para cargas de trabajo informáticas y de IA.
Ellos cuentan software que acelera aún más las aplicaciones de IA, nube, procesamiento de datos y HPC en todo tipo de data center, incluidos aquellos que incorporan la línea de productos basada en la arquitectura NVIDIA Blackwell recientemente lanzada.
Se trata de una capacidad de ancho de banda 5 veces mayor y un aumento de 9 veces de 14.4 Tflops de computación en red con el protocolo de reducción y agregación jerárquica escalable de NVIDIA (SHARPv4) en comparación con la generación anterior.
La plataforma Spectrum-X800 ofrece un rendimiento de red optimizado para la nube de IA y la empresa.rise infraestructura. Utilizando el conmutador Spectrum SN5600 de 800 Gb/s y NVIDIA BlueField-3 SuperNIC, la plataforma Spectrum-X800 proporciona conjuntos de funciones avanzadas cruciales para nubes de IA generativas multiinquilino y grandes empresas.rises.
Soluciones Quantum-Microservicios de simulación informática
NVIDIA también lanzó un servicio en la nube que permite a investigadores y desarrolladores superar los límites de quantum exploración informática en dominios científicos clave, incluida la química, la biología y la ciencia de materiales.
NVIDIA Quantum La nube se basa en CUDA-Q de código abierto de la empresa quantum plataforma informática, que es utilizada por tres cuartas partes de las empresas que implementan quantum unidades de procesamiento o QPU.
Como microservicio, permite a los usuarios por primera vez crear y probar en la nube nuevos quantum algoritmos y aplicaciones, incluidos potentes simuladores y herramientas para híbridos quantum-programación clásica.