Cloudera se asocia con Nvidia para expandir el uso de GPU en aplicaciones de IA

Únase a GamesBeat Summit 2021 del 28 al 29 de abril. Regístrese hoy para obtener un pase gratuito o VIP.


Cloudera y Nvidia anunciaron una colaboración que permitirá a las organizaciones utilizar GPU en más áreas a lo largo del ciclo de vida del desarrollo de la IA.

Cloudera integrará su plataforma de datos Cloudera con las bibliotecas aceleradas Apache Spark 3.0 de Nvidia. La integración facilitará la incorporación de flujos de trabajo de aprendizaje automático a los procesos y la creación de arquitecturas sin necesidad de personalizar la GPU. Las empresas podrán realizar cambios en sus flujos de trabajo de ciencia de datos sin tener que actualizar también la integración de Nvidia manualmente.

Las GPU han demostrado ser tremendamente prometedoras a la hora de mejorar el lado de la ciencia de datos del desarrollo de la IA, lo que permite a las empresas ejecutar algunos tipos de cargas de trabajo sobre las GPU. Sin embargo, los análisis a menudo involucran procesos que abarcan varios equipos, lo que obliga a las empresas a invertir en la personalización de integraciones de GPU para esos casos de uso.

Gartner ha predicho que la creación de nuevos patrones de arquitectura que ayuden operacionalizar la ciencia de datos y las canalizaciones de ML será una de las grandes tendencias en 2021.

Beneficios de acelerar las GPU

La asociación permitirá a las empresas utilizar GPU en flujos de trabajo de datos modernos que abarcan la preparación de datos, la ciencia de datos y las tareas de análisis. El flujo de trabajo típico incluye muchos pasos, incluida la ingestión de datos, la conservación de datos, la automatización de la canalización de datos, la exploración de la ciencia de datos, el desarrollo de modelos, las pruebas, la implementación, la supervisión y reentrenamiento de modelos y la entrega al negocio. Cloudera ha estado ocupado en hacer estos procesos y las transferencias entre ellos mucho más fáciles durante el último año.

Las bibliotecas Apache Spark 3.0 se aceleran utilizando la plataforma RAPIDS de Nvidia, que acelerará drásticamente gran parte del aburrido trabajo de preparación necesario para poner en producción nuevos modelos de aprendizaje automático. Por ejemplo, el Servicio de Impuestos Internos de EE. UU. Ya está experimentando una mejora triple en los flujos de trabajo de ciencia de datos para la detección de fraudes, dijo Joe Ansaldi, jefe de la rama técnica del IRS para la División de Estadísticas y Análisis Aplicados de Investigación, en un comunicado.

Acelerar las tareas de preparación de datos y los modelos de capacitación más rápidamente también ahorrará costos de infraestructura. Apache Spark 3 acelerado por GPU se ejecuta de forma nativa en CDP y puede conectarse a herramientas informáticas de alto rendimiento, dijo Cloudera.

Comparación de cargas de trabajo de CPU y GPU

Arriba: Comparación de los flujos de trabajo con CPU y GPU.

Crédito de la imagen: Cloudera

Portafolio de datos de Cloudera

Cloudera fue un pionero en el desarrollo de lagos de datos construidos sobre la plataforma Hadoop. Cloudera se fusionó con Hortonworks, otro proveedor de Hadoop, en 2018 y combinó las tecnologías en una arquitectura moderna llamada Cloudera Data Platform (CDP). En ese momento, muchos especularon que esto significaba el final de los almacenes de datos de Hadoop, pero Cloudera ha continuado innovando y extendiendo Hadoop a un flujo de trabajo más ágil.

Cloudera agregó Applied ML Prototypes (AMP), un marco para empaquetar modelos de IA y ML para científicos de datos, a CDP a principios de este año. Los AMP permiten a los equipos eliminar las conjeturas de los proyectos de ML con plantillas de aplicaciones empresariales prediseñadas para casos de uso específicos y, a menudo, se ejecutan en hardware GPU de Nvidia. Cloudera Data Engineering (CDE) agiliza la ingeniería de datos y el trabajo de preparación al inicio de un proyecto. Esto resolvió problemas comunes a los que se enfrentan los ingenieros de datos, como la programación y la orquestación de datos complejos, la resolución de problemas y las herramientas de ajuste del rendimiento para los flujos de datos, y la mejora de la colaboración con los equipos analíticos y de ciencia de datos.

El acelerador RAPIDS para Apache Spark estará disponible en CDP Private Cloud este verano. Nvidia y Cloudera lanzarán ofertas adicionales aceleradas en CDP con el tiempo, comenzando con Accelerated Deep Learning y Machine Learning en CDP Public Cloud en mayo. “Esto significa que no importa dónde los clientes requieran estas GPU (desde las instalaciones locales hasta la nube pública, la nube híbrida y más), podrán aprovechar las mejores GPU de su clase listas para usar”, dijo Santiago Giraldo. Director de marketing de productos de Cloudera para ingeniería de datos y aprendizaje automático.

VentureBeat

La misión de VentureBeat es ser una plaza urbana digital para que los responsables de la toma de decisiones técnicas obtengan conocimientos sobre tecnología transformadora y realicen transacciones. Nuestro sitio ofrece información esencial sobre tecnologías y estrategias de datos para guiarlo a medida que dirige sus organizaciones. Te invitamos a convertirte en miembro de nuestra comunidad, para acceder a:
  • información actualizada sobre los temas de su interés
  • nuestros boletines
  • contenido exclusivo de líderes de opinión y acceso con descuento a nuestros preciados eventos, como Transformar 2021: Aprende más
  • funciones de red y más
Hágase miembro

Source: VentureBeat by feedproxy.google.com.

*The article has been translated based on the content of VentureBeat by feedproxy.google.com. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!

*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.

*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!