AMD, de la voz de su CEO Lisa Su y de su CTO Mark Papermaster, presentaron oficialmente la próxima generación Zen, y nos referimos a los Zen 2, que impulsará los próximos procesadores Epyc y también los Ryzen. Los primeros procesadores con esta tecnología serán los Epyc Rome, CPU’s dedicadas a servidores, que se presentarán en 2019. Ya con los Ryzen, se espera que la serie 3000 (Castle Peak) presente Zen 2 y también estarán en el mercado el año próximo.

Gracias a la colaboración con TSMC, AMD será la primer empresa de procesadores en fabricar a 7nm, lo que representa un avance dentro de la tecnología informática muy futurista. Recordemos que actualmente casi todos los procesadores están construidos en 14nm, por lo que reducirán en un solo paso a la mitad la cantidad de nanómetros, y aumentarán las capacidades de los mismos. Estos son los puntos claves presentados por AMD en este evento:

  • Tendrá un Nodo Mayor de Inversión Significativa.
  • Transistores de potencia más pequeños y más rápidos (densidad 2X, potencia 0.5X, rendimiento 1.25X)
  • Múltiples productos en desarrollo.
  • Alianza con TSMC y con proveedores de automatización de diseño.

AMD ha logrado esto a través cambios significativos en su arquitectura de CPU, para entregar el doble del rendimiento sobre su arquitectura Zen de primera generación. Los puntos principales incluyen un proceso de ejecución completamente rediseñado, los principales avances en el punto flotante, lo duplicaron a 256 bits, y un ancho de banda doble para las unidades de carga/almacenamiento. Una de las mejoras clave para Zen 2 es duplicar la densidad del núcleo, lo que significa que ahora tendrán el doble del número de núcleos por cada núcleo complejo (CCX). Otras características destacables son:

  • Ejecución mejorada de Pipeline.
  • Punto flotante duplicado (a 256 bits) y ancho de banda duplicado.
  • Doble densidad de núcleos.
  • La mitad de consumo de energía por operación.
  • Branch Prediction mejorada.
  • Mejor instrucción para Pre-Fetching.
  • Caché de instrucciones optimizada.
  • Mayor Caché de operaciones.
  • Aumento de ancho de banda de “dispacht/retire”.
  • Mantener un alto rendimiento en todos los modos.

Zen 2 también incluye mejoras a nivel de hardware, ahora más fuerte tratándose de seguridad. Esto refuerza aún más las CPU de AMD frente a las variantes de Enhanced Specter, y estos cambios se adoptarán totalmente como Zen 2. Cuando se trata de Zen, AMD ya contaba con un soporte de nivel de software muy sólido, en cuanto a seguridad y lo han mejorado aún más a través de mitigaciones de software de bajo nivel.

Epyc Rome será el primero, AMD lo anuncia como el primer procesador en el mundo para base de datos en 7nm, y aunque el enfoque de estas CPU’s son los ambientes de servidores, redes avanzadas, manejo de bases de datos y la nube (cloud), nos da un avance del comportamiento que pueda tener esta nueva tecnología en un ambiente más orientado a juegos y aplicaciones más comunes.

Con Epyc Rome, AMD está haciendo todo lo posible para utilizar varios chips de CPU de 7 nm en múltiples matrices ó CCX basadandose en su arquitectura Zen 2, conectadas con un troquel de I/O de 14nm que controla toda la memoria, las I/O y las interconexiones en el DIE de la CPU a través de conexiones de acceso directo.

AMD confirmó que los procesadores del servidor de la serie Epyc Rome utilizarían dos chips de CPU de 7nm que se conectarán a un gran troquel de I/O. Los chips de CPU podrán alojar hasta 64 núcleos y 128 hilos. Los procesadores EPYC Rome también tendrán acceso mucho más rapido a los canales de memoria DDR4 de 8 canales, lo que permite un mayor ancho de banda. Este enfoque permitirá en el futuro diseños más flexibles, ya que con un troquel separado para la I/O permitirá un acceso más rápido entre la memoria y el chip.

Otros datos de rendimiento que AMD compartió relacionados a los Epyc Rome incluyen:

  • Doble (2X) de rendimiento por socket.
  • Hasta 4 veces más velocidad en el punto flotante por socket.

Específicamente para la primera gama de servidores de 7nm, AMD hizo suposiciones en torno a la hoja de ruta de Intel y qué harían si fueran Intel. Esto es particularmente curioso, ya que Intel no da ejemplos parecidos en sus eventos. Si tomamos en cuenta la curba exponencial que muestra el salto de los 14nm, luego a los 12nm, y al final a 7nm entendemos con más claridad de que es un salto muy logrado.

Se confirmó también que familia de CPU’s de AMD del 2019 está diseñada para enfrentar favorablemente a los 10nm “Ice Lake” Xeon de Intel y el panorama se ve realmente bien para AMD, ya que la gama Epyc Rome solo competirá contra la familia renovada para servidores en 14nm ++ de Intel, también conocida como Cascade Lake-SP. Es poco probable que los procesadores Ice Lake-SP de Intel basados ​​en el proceso de 10nm lleguen a la gama Xeon hasta 2020.

AMD Raden Instinct MI60

AMD también ha anunciado, a través del SVP David Wang, la GPU Radeon Instinct MI60, que también es la primera tarjeta gráfica del mundo en 7nm FinFET, mostrada públicamente. El acelerador de gráficos está dirigido al mercado de HPC y utiliza la última GPU Vega 20 de 7nm para proporcionar un aumento de densidad sin precedentes en cantidades de cómputo y ancho de banda.

El AMD Radeon Instinct MI60 usa la GPU Vega 20, que es la primera GPU de 7 nm de AMD. El diseño del Vega de 14nm fue portado a 7nm y la prioridad optimizada para el sector HPC. Esto le dio a AMD la oportunidad de utilizar completamente la arquitectura Vega, aprovechando sus capacidades de cómputo y dándoles un paso adelante.

La GPU Vega 20 cuenta con un total de 13 billones de transistores que se empaquetan dentro de 331mm2 . Definitivamente, es un diseño de alta densidad y notese que AMD también ha optimizado ligeramente sus núcleos GCN en Vega 20. Con 7nm, AMD puede optimizar su funcionamiento a velocidades de reloj más rápidas, permitiendo hasta 7.4TFlop de cómputos de doble precisión, el doble que en las operaciones de precisión simple de 14.8TFlop y de manera similar , el doble de las operaciones de media precisión, clasificadas en 29.5TFlop.

Con 64 unidades de cómputo, conforman 4096 procesadores de flujo, pero, optimizados enormemente para el mercado de HPC, por lo que ofrecen operaciones de cómputo más rápidas y agregan conjuntos de instrucciones DLL/ML. Hablando de las operaciones “Deep Learning”, el Instinct MI60 ahora soporta tanto INT8 como INT4 con una potencia de cálculo teórica máxima con 118 TFLOP en INT4 y 59.0 TFLOP en INT8.

Respecto a la memoria, tendrán versiones de 32GB de VRAM HBM2 con un ancho de banda sin precedentes de 1TB/s. AMD utiliza cuatro stacks de HBM2 que usan un diseño 8-Hi y permite la capacidad VRAM más grande y más densa que se haya presentado en una GPU de un solo chip. Además de las especificaciones, el Radeon Instinct MI60 es totalmente compatible con la pila de software ROCM de AMD, además de hacer uso de un nuevo motor de aprendizaje automático que extenderá los esfuerzos de AMD en el area de Deep Learning e inteligencia artificial (AI).

Las características principales de las GPU’s AMD Radeon Instinct MI60 y MI50 incluyen:

  • Operaciones de aprendizaje profundo optimizadas: proporciona capacidades flexibles de FP16, FP32 e INT4/INT8 de precisión mixta para satisfacer la creciente demanda de cargas de trabajo dinámicas y siempre cambiantes, desde el entrenamiento de redes neuronales complejas hasta la inferencia de ejecución contra esas redes capacitadas.
  • El acelerador PCIe de doble precisión más rápido del mundo: AMD Radeon Instinct MI60 es el acelerador capaz de PCIe 4.0 de doble precisión más rápido del mundo, con un rendimiento máximo de 7.4 TFLOPS FP64 que permite a los científicos e investigadores procesar de manera más eficiente las aplicaciones de HPC en una gama de industrias, incluyendo ciencias de la vida. Energía, finanzas, automotriz, aeroespacial, académicos, gobierno, defensa y más. AMD Radeon Instinct MI50 ofrece hasta 6.7 TFLOPS FP64 con un rendimiento máximo al tiempo que proporciona una solución eficiente y económica para una variedad de cargas de trabajo de aprendizaje profundo, además de permitir una alta reutilización en Infraestructura de escritorio virtual (VDI), Desktop-as-a- Servicio (DaaS) y entornos de nube.
  • Transferencia de datos más rápida, hasta 6X: dos Infinity Fabric Links por GPU, ofreciendo hasta 200 GB/s de ancho de banda de igual a igual (hasta 6X más rápido que PCIe 3.0 solo) y permiten la conexión de hasta 4 GPU en una configuración de anillo en forma de colmena (2 colmenas en 8 servidores).
  • Memoria HBM2 ultrarrápida : AMD Radeon Instinct MI60 proporciona 32 GB de memoria con código de corrección de errores (ECC) HBM2, y Radeon Instinct MI50 proporciona 16 GB de memoria ECC HBM2. Ambas GPU proporcionan tecnologías de ECC y fiabilidad, accesibilidad y facilidad de servicio (RAS) de chip completo, que son fundamentales para proporcionar resultados informáticos más precisos para implementaciones de HPC a gran escala.
  • Soporte seguro de la carga de trabajo virtualizada: la tecnología AMD MxGPU, la única solución de virtualización de GPU basada en hardware de la industria, que se basa en la tecnología estándar SR-IOV (virtualización de E/S de raíz única) hace que sea difícil para los piratas informáticos atacar el hardware nivel, ayudando a proporcionar seguridad para implementaciones de nube virtualizadas.

AMD también compartió una hoja de ruta que muestra un nuevo producto de Radeon Instinct, actualmente denominado “MI-Next” que se lanzará el próximo año, con un mayor rendimiento, mayor conectividad y una mejor compatibilidad de software. En cuanto al Radeon Instinct MI60, se espera que se envíe este trimestre, lo que de hecho lo convierte en la primera tarjeta gráfica de 7nm que llega al mercado, ya que no hay ningún otro producto de GPU de 7nm de la competencia que salga a futuro. También habrá la GPU Radeon Instinct MI50, una variante del MI60 de menor capacidad. Ambas tarjetas contarán con conectores duales de 8 pines y el MI60 contará con un TDP de 300W.