Noticias

NVIDIA presenta su nueva clase de GPU Rubin CPX, para inferencia en contextos amplios

Publicado el

10 septiembre, 2025

por

NVIDIA presenta su nueva clase de GPU Rubin CPX, para inferencia en contextos amplios

NVIDIA ha presentado su nueva GPU Rubin CPX aprovechando la celebración del evento AI Infrastructure Summit. Diseñada para ventanas de contexto superiores al millón de tokens, la GPU está optimizada para el proceso de secuencias grandes de contexto, y pensada para utilizar como parte de un enfoque de infraestructura centrada en lo que se conoce como inferencia desagregada.

Para los usuarios, la integración de esta GPU tendrá como resultado un mayor rendimiento en tareas con un contexto amplio en los sistemas que la lleven, sobre todo, en generación de vídeo y desarrollo de software. Según han confirmado desde la empresa, todavía tendremos que esperar bastante tiempo hasta su aparición, puesto que llegará a finales del próximo año 2026.

Esta GPU se ofrecerá en forma de tarjetas que se podrán integrar en diseños de servidores o en ordenadores discretos, que pueden funcionar de manera independiente junto con otro hardware en centros de datos

El diseño es un derivado de la línea de producto Rubin, que llegará el próximo año. Según NVIDIA, se ha desarrollado porque es necesario para llevar a cabo determinados tipos de trabajo con IA de forma más eficiente. Tal como han manifestado desde la empresa, algunos elementos del área de inferencia de la computación con IA, como el proceso de generación de respuestas a peticiones, no son tan eficientes como deberían.

Esto se debe, al parecer, a que un chip, un tipo de GPU, se encarga de la comprensión de la petición de entrada, y después crea y suministra la respuesta a ella. Al separar la parte de comprensión de la generación de respuesta, lo que puede hacer este nuevo tipo de CPU, NVIDIA cree que sus clientes tendrán un hardware más eficiente.

Este sistema NVIDIA MGX integrado cuenta con 8 exaflops de potencia de computación de IA, 100 TB de memoria rápida y 1,7 pertabytes por segundo de ancho de banda de memoria en un solo rack. Se ha desarrollado a partir de la arquitectura Rubin.

Emplea un diseño de matriz monolítico con recursos NVFP4 optimizado para ofrecer un rendimiento y una eficiencia energética muy altos, tal como se necesita para tareas de inferencia de IA. En lo que respecta a la generación de vídeo y multimedia, los chips de la serie Rubin CPX de Nvidia permitirá contar con sistemas capaces de decodificar, codificar y procesar en un único chip.

Según el CEO de NVIDIA, Jensen Huang, «la plataforma Vera Rubin supondrá otro gran avance en la frontera de la informática basada en IA, ya que introducirá tanto la GPU Rubin de última generación como una nueva categoría de procesadores denominada CPX. Al igual que RTX revolucionó los gráficos y la IA física, Rubin CPX es la primera GPU CUDA diseñada específicamente para la IA de contexto masivo, en la que los modelos razonan a partir de millones de tokens de conocimiento a la vez«

Categorías relacionadas:GPU NVIDIA NVIDIA Rubin CPX

A continuación

Cadence Design compra la división de diseño e ingeniería de Hexagon

No te pierdas

El gigante europeo de maquinaria de fabricación de chips ASML invierte 1.300 millones en Mistral AI

Celia Valdeolmillos

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Casi a la mitad de los trabajadores digitales les cuesta localizar los datos que necesitan

ContentHace 6 días

CRM e Inteligencia Artificial en el área comercial

Renfe integrará un nuevo servicio de conectividad a bordo de sus trenes AVE y Larga Distancia

NoticiasHace 6 días

Renfe integrará un nuevo servicio de conectividad a bordo de sus trenes AVE y Larga Distancia

Abierta a consulta pública la propuesta europea de la Ley de Chips 2.0

NoticiasHace 6 días

Abierta a consulta pública la propuesta europea de la Ley de Chips 2.0

Cloudflare Precursor, defensa contra bots basada en el comportamiento con un solo click

NoticiasHace 6 días

Cloudflare Precursor, defensa contra bots basada en el comportamiento con un solo click

MuyComputerPRO

NVIDIA presenta su nueva clase de GPU Rubin CPX, para inferencia en contextos amplios

Noticias

NVIDIA presenta su nueva clase de GPU Rubin CPX, para inferencia en contextos amplios

Airbus pasa sus sistemas más sensibles de AWS a la francesa Scaleway

El director del Grupo SK admite que los precios de las memorias son «anormalmente altos»

Multa de 550 millones de euros a AliExpress por incumplir la Ley de Servicios Digitales

Europa avanzará en soberanía tecnológica para 2030, pero seguirá por detrás de China y EEUU

QNAP QAI-h1290FX, un servidor de almacenamiento y computación que ejecuta IA generativa

Nokia presenta su plataforma comercial AI-RAN

LineShine: China supera a EE.UU alcanzando el primer puesto del TOP500 de supercomputadoras

OpenAI amplía su iniciativa de ciberseguridad Daybreak

El precio de la tecnología cliente se dispara a medida que la IA sigue acaparando chips

Demandan a Samsung, SK Hynix y Micron por acordar mantener la escasez de RAM para subir precios

Accenture, en problemas: sus acciones caen hasta su valor más bajo desde 2017

De la ilusión de productividad a la UX fluida: IA y DXOP en la trinchera del empleado

Airbus pasa sus sistemas más sensibles de AWS a la francesa Scaleway

La nueva versión de PowerToys reúne las herramientas más avanzadas de Windows

Accenture, en problemas: sus acciones caen hasta su valor más bajo desde 2017

OVH anuncia una plataforma de IA agéntica abierta y colaborativa: OVHai Workspace

De la ilusión de productividad a la UX fluida: IA y DXOP en la trinchera del empleado

El precio de la tecnología cliente se dispara a medida que la IA sigue acaparando chips

Lo más leído

MuyComputerPRO

NVIDIA presenta su nueva clase de GPU Rubin CPX, para inferencia en contextos amplios

También te puede gustar

Airbus pasa sus sistemas más sensibles de AWS a la francesa Scaleway

El director del Grupo SK admite que los precios de las memorias son «anormalmente altos»

Multa de 550 millones de euros a AliExpress por incumplir la Ley de Servicios Digitales

Europa avanzará en soberanía tecnológica para 2030, pero seguirá por detrás de China y EEUU

QNAP QAI-h1290FX, un servidor de almacenamiento y computación que ejecuta IA generativa

Nokia presenta su plataforma comercial AI-RAN

LineShine: China supera a EE.UU alcanzando el primer puesto del TOP500 de supercomputadoras

OpenAI amplía su iniciativa de ciberseguridad Daybreak

El precio de la tecnología cliente se dispara a medida que la IA sigue acaparando chips

Demandan a Samsung, SK Hynix y Micron por acordar mantener la escasez de RAM para subir precios

Accenture, en problemas: sus acciones caen hasta su valor más bajo desde 2017

De la ilusión de productividad a la UX fluida: IA y DXOP en la trinchera del empleado

Airbus pasa sus sistemas más sensibles de AWS a la francesa Scaleway

La nueva versión de PowerToys reúne las herramientas más avanzadas de Windows

Accenture, en problemas: sus acciones caen hasta su valor más bajo desde 2017

OVH anuncia una plataforma de IA agéntica abierta y colaborativa: OVHai Workspace

De la ilusión de productividad a la UX fluida: IA y DXOP en la trinchera del empleado

El precio de la tecnología cliente se dispara a medida que la IA sigue acaparando chips

Lo más leído