CasaNoticiasSupercomputadora que resuelve los cuellos de botella en la velocidad de la IA

Supercomputadora que resuelve los cuellos de botella en la velocidad de la IA







Los investigadores y las instituciones académicas ahora pueden ejecutar grandes modelos de IA, simulaciones y experimentos con uso intensivo de datos de manera eficiente con una supercomputadora de alto rendimiento.

La investigación en inteligencia artificial es cada vez más limitada debido a la limitada potencia informática.Entrenar modelos grandes, ejecutar simulaciones complejas y procesar conjuntos de datos masivos requiere sistemas de alto rendimiento.En América Latina, las instituciones académicas han enfrentado limitaciones en infraestructura, lo que ha frenado la innovación en IA y ha limitado el desarrollo de modelos adaptados a los contextos locales.Los investigadores necesitaban entornos escalables capaces de soportar cargas de trabajo de informática científica, aprendizaje automático e inteligencia artificial con uso intensivo de datos.

La supercomputadora Jairu aborda esta necesidad.Equipado con 96 GPU NVIDIA B200 y servidores Supermicro, permite a los investigadores ejecutar modelos de IA, realizar simulaciones y procesar algoritmos complejos de manera eficiente.El sistema integra almacenamiento de alta capacidad e interconexiones de baja latencia, lo que reduce los cuellos de botella y permite experimentos a gran escala.

Su arquitectura proporciona varias ventajas.Los nodos principales administran el entorno, incluido el inicio de sesión, la orquestación y la distribución de la carga de trabajo.Los nodos GPU siguen el estándar HGX y utilizan NVLink para una comunicación rápida entre GPU.El almacenamiento y las redes están diseñados para mantener un alto rendimiento y una baja latencia.El sistema también incluye software para gestión centralizada, programación de GPU y reproducibilidad de experimentos.

Las características clave de la supercomputadora incluyen:

Cinco nodos principales se encargan de la gestión, el inicio de sesión y la orquestación.
Cada uno de los 12 nodos de GPU tiene 8 GPU NVIDIA B200 SXM-5.
NVLink conecta GPU para una comunicación rápida.
El almacenamiento utiliza BeeGFS con alrededor de 300 TB utilizables.
La conexión en red combina Ethernet de 200 Gb/s e InfiniBand de 800 Gb/s.
El software NVIDIA AI gestiona cargas de trabajo y programa tareas.
Fabio G. Cozman, del Centro de Inteligencia Artificial y Aprendizaje Automático (CIAAM-USP) de la USP, dice: “Con Jairu, tenemos una infraestructura de IA que nos permitirá desarrollar grandes modelos y profundizar investigaciones relevantes para el contexto brasileño”.Al combinar hardware de alto rendimiento, software empresarial e ingeniería especializada, el sistema fortalece la capacidad académica y la competitividad de Brasil en inteligencia artificial y computación de alto rendimiento.