Noticias
NVIDIA presenta su nueva clase de GPU Rubin CPX, para inferencia en contextos amplios
NVIDIA ha presentado su nueva GPU Rubin CPX aprovechando la celebración del evento AI Infrastructure Summit. Diseñada para ventanas de contexto superiores al millón de tokens, la GPU está optimizada para el proceso de secuencias grandes de contexto, y pensada para utilizar como parte de un enfoque de infraestructura centrada en lo que se conoce como inferencia desagregada.
Para los usuarios, la integración de esta GPU tendrá como resultado un mayor rendimiento en tareas con un contexto amplio en los sistemas que la lleven, sobre todo, en generación de vídeo y desarrollo de software. Según han confirmado desde la empresa, todavía tendremos que esperar bastante tiempo hasta su aparición, puesto que llegará a finales del próximo año 2026.
Esta GPU se ofrecerá en forma de tarjetas que se podrán integrar en diseños de servidores o en ordenadores discretos, que pueden funcionar de manera independiente junto con otro hardware en centros de datos
El diseño es un derivado de la línea de producto Rubin, que llegará el próximo año. Según NVIDIA, se ha desarrollado porque es necesario para llevar a cabo determinados tipos de trabajo con IA de forma más eficiente. Tal como han manifestado desde la empresa, algunos elementos del área de inferencia de la computación con IA, como el proceso de generación de respuestas a peticiones, no son tan eficientes como deberían.
Esto se debe, al parecer, a que un chip, un tipo de GPU, se encarga de la comprensión de la petición de entrada, y después crea y suministra la respuesta a ella. Al separar la parte de comprensión de la generación de respuesta, lo que puede hacer este nuevo tipo de CPU, NVIDIA cree que sus clientes tendrán un hardware más eficiente.
Este sistema NVIDIA MGX integrado cuenta con 8 exaflops de potencia de computación de IA, 100 TB de memoria rápida y 1,7 pertabytes por segundo de ancho de banda de memoria en un solo rack. Se ha desarrollado a partir de la arquitectura Rubin.
Emplea un diseño de matriz monolítico con recursos NVFP4 optimizado para ofrecer un rendimiento y una eficiencia energética muy altos, tal como se necesita para tareas de inferencia de IA. En lo que respecta a la generación de vídeo y multimedia, los chips de la serie Rubin CPX de Nvidia permitirá contar con sistemas capaces de decodificar, codificar y procesar en un único chip.
Según el CEO de NVIDIA, Jensen Huang, «la plataforma Vera Rubin supondrá otro gran avance en la frontera de la informática basada en IA, ya que introducirá tanto la GPU Rubin de última generación como una nueva categoría de procesadores denominada CPX. Al igual que RTX revolucionó los gráficos y la IA física, Rubin CPX es la primera GPU CUDA diseñada específicamente para la IA de contexto masivo, en la que los modelos razonan a partir de millones de tokens de conocimiento a la vez«
-
NoticiasHace 6 díasOpenText ofrecerá sus soluciones en las nubes de AWS y Google Cloud en Europa
-
A FondoHace 6 díasAlerta Hardware 2026: la insaciable IA encarece servidores, workstations y computadoras clientes
-
NoticiasHace 6 díasCapgemini anuncia un ERE para sus trabajadores en España y echa la culpa a la IA
-
EntrevistasHace 5 días«La unión de máquina y humano va a vencer sesgos que arrastramos históricamente»

