A Fondo

Zen 2 y Vega 20: AMD responde a los desafíos del sector profesional

Publicado el

14 noviembre, 2018

por

El evento Next Horizon 7 que AMD celebró recientemente en San Francisco nos dejó muchas sorpresas. La compañía de Sunnyvale hizo anuncios importantes, tanto a nivel de arquitectura CPU con Zen 2 como a nivel de arquitectura GPU con Vega 20, pero no se olvidó de la importancia que tienen partners y software cuando nos movemos en el sector profesional, de ello dan fe los anuncios de nuevas herramientas profesionales y también la confirmación de nuevas alianzas con gigantes del calibre de Amazon.

Si lanzamos la vista atrás y echamos un vistazo a los últimos cinco años de historia de AMD nos daremos cuenta de que la compañía de Sunnyvale ha atravesado por un periodo complicado. La arquitectura modular Bulldozer y sus derivados acabaron siendo un fracaso tan grande que la colocaron en una posición muy difícil. En pleno 2016 pocos creían que la firma que dirige Lisa Su fuese capaz de recuperarse, pero la llegada de Zen disipó de plano todos los malos augurios.

Con Zen AMD volvió al buen camino, y lo hizo en todos los frentes; en consumo con los procesadores Ryzen, en HEDT (computación de alto rendimiento) con Threadripper, y en servidores con EPYC, tres líneas de procesadores que comparten arquitectura y una misma base: ofrecer un buen rendimiento y un consumo equilibrado manteniendo un coste equilibrado, no solo en lo que respecta al precio de venta, sino también al coste de propiedad, que como sabemos es un punto clave cuando hablamos de centros de datos.

Zen 2: mejorando los valores de Zen

Esos tres valores no solo se han mantenido con Zen 2, la arquitectura que sucederá a Zen, sino que se han potenciado. A nivel de arquitectura Zen 2 representa un paso adelante frente a la anterior pero parte de la misma base: una estructura simplificada que permita conseguir un alto rendimiento por oblea de silicio. Esto es fundamental, ya que al conseguir una mayor cantidad de chips funcionales por oblea AMD puede comercializar sus procesadores a un precio más bajo, y tiene además un mayor margen de maniobra.

Suena bien, pero seguro que os preguntáis cómo ha logrado esto la compañía de Sunnyvale. En Zen teníamos una arquitectura MCM (módulo multi-chip), un modelo que se opone totalmente al diseño tradicional de núcleo monolítico. La primera apuesta por varios bloques de núcleos encapsulados en unidades CCX que conectan con otras unidades CCX para dar forma a diseños complejos con un alto conteo de núcleos. Por ejemplo, un procesador EPYC Naples tiene hasta 32 núcleos y 64 hilos, que están divididos en cuatro unidades CCX de ocho núcleos cada una, comunicadas entre sí a través del sistema Infinity Fabric.

Por contra, la arquitectura de núcleo monolítico agrupa en un único bloque todos los núcleos. Esto quiere decir que un procesador Xeon de última generación de 28 núcleos y 56 hilos tiene todos esos núcleos integrados en una única pastilla de silicio, y que no necesita de un sistema de intercomunicación que los una.

Ambas arquitecturas tienen sus ventajas y sus desventajas. La arquitectura MCM que utiliza AMD es más barata de producir, ya que de cada oblea de silicio se obtienen chips de hasta 8 núcleos. Sin embargo, al tratarse de un sistema modular unido a través de Infinity Fabric se producen latencias más elevadas y se genera una mayor dependencia de otros elementos, como la configuración de memoria RAM utilizada. Esto hace que en general su rendimiento sea algo inferior al que podríamos obtener con un diseño de núcleo monolítico.

Como habréis podido deducir los diseños de núcleo monolítico son más complejos de producir por una razón muy simple: cada chip que se obtiene de una oblea tiene una configuración de núcleos concreta, y en los modelos tope de gama hablamos de hasta 28 núcleos. A mayor cantidad de núcleos mayor complejidad del diseño y más posibilidades de que algo salga mal, lo que reduce la tasa de éxito por oblea y aumenta significativamente los costes de producción. Esos son, a grades rasgos, los puntos clave que definen a una y otra arquitectura.

Con Zen 2 se mantiene ese enfoque MCM, pero hay un cambio muy importante que afecta al diseño y que supone una simplificación del mismo: ya no tenemos unidades CCX, sino lo que AMD conoce como chiplets. En Zen cada bloque de núcleos estaba acompañado de su controlador de memoria y su sistema I/O básico, elementos que ahora se han desplazado a un nuevo encapsulado central que agrupa todos esos componentes, además de un sistema de comunicación «Infinity Fabric» mejorado.

Los chiplets están fabricados en proceso de 7 nm y solo integran los núcleos y suman un máximo de ocho cada uno, lo que multiplicado por los ocho encapsulados presentes en EPYC de segunda generación (Rome) nos deja un total de 64 núcleos. En el centro del chip tenemos el encapsulado donde va todo el sistema I/O, y a diferencia de los chiplets está fabricado en proceso de 14 nm. Según AMD este diseño ha sido clave para simplificar y abaratar la transición al proceso de 7 nm, y también para mejorar el rendimiento general de su nueva arquitectura.

El salto a los 7 nm: mayor rendimiento, seguridad y eficiencia

Todo lo que hemos expuesto anteriormente nos permite entender cómo ha conseguido AMD adelantarse y ganar la carrera hacia los 7 nm: apostando por una arquitectura modular que en lugar de perseguir únicamente la potencia bruta se centra en alcanzar un equilibrio en términos de rendimiento, consumo y coste.

Podemos considerar esas tres claves como tres pilares básicos cuando hablamos de servidores y centros de datos, y en general de cualquier tipo de equipo profesional. La potencia importa a las empresas y a los profesionales, pero la relación de costes que derivan del precio de compra y del coste de propiedad también. En este sentido el consumo energético y los gastos derivados de la disipación del calor generado por el trabajo de grandes grupos de servidores trabajando en conjunto juega un papel muy importante.

La arquitectura MCM simplifica el diseño y ayuda a reducir el precio de venta. También reduce la complejidad del chip y el consumo bruto, dos claves que AMD ha llevado un paso más allá con el salto al proceso de 7 nm, un avance que según la compañía de Sunnyvale permite:

Reducir hasta en un 50% el consumo energético (transistores más pequeños) manteniendo el mismo rendimiento.
Aumentar hasta en un 25% el rendimiento con el mismo consumo de la generación anterior.

Si extrapolamos estos datos podemos sacar en claro que gracias al proceso de 7 nm AMD podría lanzar un procesador EPYC Rome basado en Zen 2 con 64 núcleos y 128 hilos manteniendo un TDP similar al que tiene actualmente EPYC Naples (Zen) en su configuración de 32 núcleos y 64 hilos (180 vatios).

En términos de rendimiento tenemos también novedades importantes que van más allá de que derivan de su mayor número de núcleos:

Sistema Infinity Fabric mejorado. Es una pieza clave, ya que de él depende la comunicación entre chiplets y las latencias.
Mejoras a nivel de pipeline para conseguir una alimentación de datos y una ejecución más eficiente y equilibrada.
Mejoras en caché e instrucciones. También en el sistema de predicción de saltos.
Importantes mejoras en las unidades de coma flotante: ahora soportan instrucciones AVX de 256 bits (128 bits en Zen).
Funciones de seguridad avanzadas, entre las que destaca la protección contra Spectre a nivel de silicio.
Mayor IPC, menor latencia en cachés y mayor ancho de banda.
Arquitectura preparada para trabajar con PCIE 4.0.
Hasta el doble de rendimiento en coma flotante frente a los procesadores Zen y Zen+.

Es importante tener en cuenta además que Zen 2, y por tanto todos los procesadores que utilicen dicha arquitectura (Ryzen 3000, Threadripper 3000 y EPYC Rome) serán compatibles con las placas base que utilizan los procesadores Zen (y también su sucesora, Zen 3), lo que significa que no será necesario afrontar una renovación parcial para poder utilizarlos. Una buena noticia, ya que significa que aquellas empresas que quieran empezar a aprovechar las ventajas de esta nueva generación no tendrán que cambiar ningún componente adiciona, solo el procesador.

AMD no ha sido ajena a las amenazas de seguridad que han azotado al sector de los procesadores x86 durante los últimos meses. Sus procesadores no sufren la vulnerabilidad Meltdown, pero sí que están afectados por Spectre en sus dos variantes. La compañía de Sunnyvale ha trabajado con sus principales socios para lanzar actualizaciones de software y de BIOS que protejan a los usuarios contra dicha vulnerabilidad, y con Zen 2 ha confirmado la introducción de cambios a nivel de silicio que ofrecen protección por hardware.

La mitigación de Spectre a nivel de hardware se ve reforzada por la introducción de otras medidas de seguridad, como por ejemplo el cifrado de memoria, dos cambios necesarios que rematan una arquitectura de primer nivel que promete ser muy competitiva.

¿Es Zen 2 un paso en la dirección correcta?

AMD ha dado forma a una arquitectura de nueva generación capaz de ofrecer un alto rendimiento, un consumo equilibrado y un alto nivel de escalabilidad. En líneas generales la compañía de Sunnyvale ha logrado cubrir todas las necesidades del sector profesional, algo que sin duda se ha dejado notar en un apoyo creciente por parte de sus principales socios.

Firmas como HPE, Dell EMC, RetHat, Microsoft Azure, CRAY y AWS (Amazon Web Services) han confirmado una alianza con AMD que prácticamente asegura el éxito de los procesadores EPYC de segunda generación. Con esto en mente la conclusión es clara: Zen 2 es algo más que un paso en la dirección correcta, es una arquitectura que podría acabar marcando un punto de inflexión en el sector.

En términos de rendimiento y seguridad marca un avance importante, pero AMD ha querido destacar además el valor que ofrecen en lo que a costes se refiere. Ya hemos hablado sobre ello en párrafos anteriores, así que no vamos a volver a profundizar sobre esa cuestión, pero está claro que es un elemento fundamental que suma o resta cuando hablamos de procesadores profesionales.

Los primeros procesadores EPYC Rome basados en el proceso de 7 nm empezarán a llegar al mercado durante el primer trimestre de 2019.

Vega 20: la primera GPU en 7 nm

El anuncio de Vega 20 no fue una sorpresa. AMD ya habló de ella hace algunos meses y confirmó que iba a ser la primera en dar el salto al proceso de 7 nm, pero no dio detalles concretos a nivel de arquitectura. Durante el evento celebrado en San Francisco Vega 20 compartió protagonismo con Zen 2, y gracias a ello tenemos una visión completa de lo que ofrece esta nueva GPU.

En líneas generales Vega 20 es una versión de Vega 10. Esto salta a la vista cuando vemos sus especificaciones, aunque incorpora mejoras que le permiten ofrecer un rendimiento superior en inferencia, FP16, FP32 y FP64. El sistema Infinity Fabric Link también juega un papel relevante, ya que permite lograr un alto grado de escalabilidad al utilizar configuraciones con más de una GPU, y su soporte del estándar PCIE 4.0 la convierte en una arquitectura pensada para durar.

Todas las soluciones basadas en Vega 20 se agrupan en la serie Radeon Instinct, lo que significa que competirán con las Tesla de NVIDIA. Son productos pensado pensados para computación de alto rendimiento, lo que significa que carecen de conectores de imagen. En la imagen adjunta podemos ver todas las especificaciones clave de los dos modelos anunciados por AMD: Radeon Instinct MI60 y MI50.

Las diferencias entre ambas no son demasiado grandes, ya que se limitan a un menor conteo de shaders (4.096 y 3.840 respectivamente) y a la cantidad de memoria. Ambas cuentan con un bus de 4.096 bits, pero la Radeon Instinct MI60 suma 32 GB de HBM2 y la Radeon Instinct MI50 tiene 16 GB de HBM2. Las dos logran un ancho de banda de 1 TB/s.

Si echamos un vistazo a las pruebas de rendimiento que ha compartido AMD nos daremos cuenta de que las mejoras introducidas en términos de arquitectura son lo bastante grandes como para marcar diferencias con la generación anterior basada en Vega 10. Sin embargo el TDP de 300 vatios se ha mantenido, algo que sin duda ha sido posible gracias al salto al proceso de 7 nm.

¿Y cómo ha conseguido AMD esa mejora de rendimiento sin elevar el número de shaders? Pues muy sencillo, introduciendo mejoras a nivel de latencia y frecuencias de trabajo, dos valores que se unen a ese mayor ancho de banda. Como no podía ser de otra forma las Radeon Instinct MI60 y MI50 utilizan memoria ECC (corrección de errores), lo que las convierte en soluciones viables para manejar grandes cantidades de datos y para trabajar con simulaciones científicas muy complejas.

El hardware es importante, pero cuando hablamos de GPUs, computación de alto rendimiento y aprendizaje profundo el software juega también un papel clave. AMD es consciente de esa realidad, y por ello no quiso cerrar su evento sin hablar del ecosistema de herramientas sobre el que se apoya, conocido como ROCm, una plataforma abierta que mantiene la apuesta de la compañía de Sunnyvale por el software libre.

Relacionados:AMD Destacados Vega 20 zen 2

A continuación

¿Por qué algunas empresas Open Source están considerando un enfoque más cerrado?

No te pierdas

AMD desvela Zen 2 y anuncia un futuro en 7 nanómetros

Isidro Ros

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.