NVIDIA presenta la plataforma de aceleración de GPU de código abierto RAPIDS

0

NVIDIA anunció hoy una plataforma de aceleración de GPU para la ciencia de la información y el aprendizaje automático, apoyada ampliamente por los líderes de la industria, que permite a las compañías más grandes analizar grandes cantidades de datos y realizar predicciones de negocios precisas a una velocidad sin precedentes.


El software de código abierto RAPIDS ofrece a los científicos y analistas de datos un aumento en el rendimiento en las GPU’s, ya que abordan desafíos empresariales altamente complejos, como predecir el fraude de tarjetas de crédito, pronosticar el inventario minorista y comprender el comportamiento de compra del cliente. Reflejando una tendencia emergente sobre la importancia de la GPU para los análisis de datos, una serie de compañías está apoyando a RAPIDS, desde pioneros en la comunidad de código abierto, como Databricks y Anaconda, hasta líderes de tecnología como Hewlett Packard Enterprise, IBM y Oracle.

Los analistas estiman que el mercado de servidores para ciencia de datos y aprendizaje automático es de $ 20 mil millones anuales, lo que, junto con el análisis científico y el aprendizaje profundo, eleva el valor del mercado de computación de alto rendimiento a aproximadamente $ 36 mil millones.

“El análisis de datos y el aprendizaje automático son los segmentos más grandes del mercado de computación de alto rendimiento que no habían avanzado, hasta ahora”, dijo Jensen Huang, fundador y CEO de NVIDIA, quien reveló RAPIDS en su discurso de apertura en la GPU Technology Conference. Huang también declaró: “las industrias más grandes del mundo ejecutan algoritmos escritos por aprendizaje automático en un mar de servidores para detectar patrones complejos en su mercado y entorno, y realizar predicciones rápidas y precisas que afectan directamente a sus resultados”.

Además dijo: “sobre la base de CUDA y su ecosistema global, y al trabajar estrechamente con la comunidad de código abierto, hemos creado la plataforma de aceleración de GPU RAPIDS. Se integra a la perfección en las bibliotecas y flujos de trabajo de ciencia de datos más populares del mundo para acelerar el aprendizaje automático. El aprendizaje a máquina con turbocompresor, como hemos hecho con el aprendizaje profundo “.

RAPIDS ofrece un conjunto de bibliotecas de código abierto para análisis acelerado por GPU, aprendizaje automático y, pronto, visualización de datos. Fue desarrollado en los últimos dos años por ingenieros de NVIDIA en estrecha colaboración con colaboradores clave de código abierto.

Por primera vez, les brinda a los científicos las herramientas que necesitan para ejecutar todo el flujo de datos en GPU. La evaluación comparativa inicial de RAPIDS, que utiliza el algoritmo de aprendizaje automático de XGBoost para el entrenamiento en un sistema NVIDIA DGX-2, muestra un aumento de velocidad de 50x en comparación con los sistemas solo para CPU. Esto permite a los científicos de datos reducir los tiempos de entrenamiento típicos de días a horas, o de horas a minutos, dependiendo del tamaño de su conjunto de datos.

RAPIDS se basa en proyectos populares de código abierto, incluidos Apache Arrow, Pandas y Scikit-Learn, al agregar la aceleración de la GPU a la cadena de herramientas de ciencia de datos de Python más popular. Para llevar bibliotecas y capacidades de aprendizaje automático adicionales a RAPIDS, NVIDIA está colaborando con contribuidores de ecosistemas de código abierto como Anaconda, BlazingDB, Databricks, Quansight y scikit-learn, así como con Wes McKinney, jefe de Ursa Labs y creador de Apache Arrow y Pandas, la biblioteca de ciencia de datos de Python de más rápido crecimiento.

“RAPIDS, una plataforma de ciencia de datos acelerada por GPU, es un ecosistema computacional de próxima generación impulsado por Apache Arrow”, dijo McKinney. “La colaboración de NVIDIA con Ursa Labs acelerará el ritmo de la innovación en las bibliotecas centrales de Arrow y ayudará a lograr importantes aumentos de rendimiento en el análisis y la carga de trabajo de ingeniería de características”. 

Para facilitar una amplia adopción, NVIDIA está integrando RAPIDS en Apache Spark, el marco de código abierto líder para análisis y ciencia de datos.

“En Databricks, estamos entusiasmados con el potencial de RAPIDS para acelerar las cargas de trabajo de Apache Spark“, dijo Matei Zaharia, cofundador y tecnólogo en jefe de Databricks, y creador original de Apache Spark. “Tenemos múltiples proyectos en curso para integrar mejor a Spark con aceleradores nativos, incluido el soporte de Apache Arrow y la programación de GPU con Project Hydrogen. Creemos que RAPIDS es una nueva y emocionante oportunidad para escalar la ciencia de datos y la carga de trabajo de AI de nuestros clientes”.

Las empresas líderes en tecnología en una amplia gama de industrias son las primeras en adoptar la plataforma de aceleración de GPU de NVIDIA y RAPIDS.

“La plataforma de aceleración de GPU de NVIDIA con el software RAPIDS ha mejorado enormemente la forma en que usamos los datos, lo que permite que los modelos más complejos se ejecuten a escala y ofrezcan pronósticos más precisos”, dijo Jeremy King, vicepresidente ejecutivo y director de tecnología de Walmart. “RAPIDS tiene sus raíces en la profunda colaboración entre NVIDIA y los ingenieros de Walmart, y planeamos construir sobre esta relación”.

Además, algunas de las principales compañías de tecnología del mundo están apoyando a RAPIDS a través de nuevos sistemas, plataformas de ciencia de datos y soluciones de software, como podemos notar en estas declaraciones:

“HPE está comprometido a mejorar la forma en que los clientes viven y trabajan. La tecnología de inteligencia artificial, analítica y aprendizaje automático puede desempeñar un papel fundamental en el descubrimiento de información que puede ayudar a los clientes a lograr resultados innovadores y mejorar el mundo en el que vivimos. HPE es único en el mercado. en el sentido de que proporcionamos soluciones completas de inteligencia artificial y análisis de datos, desde asesoría estratégica hasta tecnología aceleradora de GPU especialmente diseñada, soporte operacional y un sólido ecosistema de socios para adaptar la solución adecuada para cada cliente. Nos complace asociarnos con NVIDIA en RAPIDS para acelerar la aplicación de ciencia de datos y aprendizaje automático para ayudar a nuestros clientes a lograr resultados más rápidos y profundos “.
– Antonio Neri, CEO de Hewlett Packard Enterprise

 

“IBM ha desarrollado la plataforma líder mundial para inteligencia empresarial, independientemente del modelo de implementación. Esperamos extender nuestra exitosa asociación con NVIDIA, aprovechando RAPIDS para proporcionar nuevas herramientas de aprendizaje automático para nuestros clientes”.
– Arvind Krishna, vicepresidente senior de Hybrid Cloud y director de IBM Research

 

“El mundo de cómputo de hoy requiere un procesamiento poderoso para manejar cargas de trabajo complejas como la ciencia de datos y el análisis. Es un trabajo para las GPU NVIDIA. RAPIDS está acelerando la velocidad a la que se puede realizar esta capacitación en procesamiento y aprendizaje automático. Estamos muy contentos de apoyar esta nueva suite. del software de código abierto de forma nativa en Oracle Cloud Infrastructure y esperamos trabajar con NVIDIA para respaldar RAPIDS en toda nuestra plataforma, incluida Oracle Data Science Cloud, para acelerar aún más los flujos de trabajo de ciencia de datos de extremo a extremo de nuestros clientes. Oracle Cloud, que permite a los clientes satisfacer sus necesidades de HPC, AI y ciencia de datos, mientras aprovechan la cartera de instancias de GPU disponibles en Oracle Cloud Infrastructure “.
– Clay Magouyrk, vicepresidente senior de desarrollo de software, Oracle Cloud Infrastructure

Con soporte de otras empresas líderes, como Cisco, Dell EMC, Lenovo, NERSC, NetApp, Pure Storage, SAP y SAS, así como una amplia gama de pioneros en ciencia de datos, se esrima que RAPIDS llegaría a convertirse en la plataforma empresarial de aceleración de GPU más usada en el mundo.