Automatización de la plataforma de ciencia de datos

Un líder mundial en servicios de alquiler vacacional aprovecha nuestra solución de Datos y Analítica para desarrollar una nueva plataforma de aprendizaje automático.

SITUACIÓN

Nuestro cliente necesitaba implementar una plataforma unificada de ciencia de datos que redujera la complejidad, los costes generales y el ancho de banda de los recursos necesarios para crear soluciones individuales de aprendizaje automático. Querían reducir la fricción entre el proceso de desarrollo de modelos de aprendizaje automático y la creación de los servicios de producción que dependen de sus datos. El objetivo de la plataforma era liberar a sus científicos de datos para que se centraran en sus habilidades principales, a la vez que les permitía desplegar más rápidamente sus soluciones en producción.

SOLUCIÓN

Nuestro equipo identificó las ineficiencias entre los equipos de ciencia de datos, desarrollo de aplicaciones y DevOps del cliente para producir un proceso de despliegue mejorado. Nos asociamos con el cliente para construir una nueva plataforma de aprendizaje automático que incluía un motor de ejecución de modelos, una API REST, un repositorio de puntuación y un canal de ingeniería de características. En concreto, nuestra solución proporcionó:

  • Despliegues y actualizaciones de modelos totalmente automatizados, sin dejar de permitir APIs extensibles y personalizaciones, con una interfaz web y de línea de comandos fácil de usar
  • Una API REST estándar para todos los modelos con perfiles de rendimiento configurables, construidos para el ajuste del rendimiento personalizado a las necesidades típicas del aprendizaje automático
  • Una canalización de datos integrada que conecta las fuentes Kafka y S3 con el modelo de aprendizaje automático, capturando las puntuaciones del modelo para su reutilización y posterior análisis

RESULTADOS

Nuestro equipo entregó exitosamente una nueva plataforma de aprendizaje automático con herramientas mejoradas para el despliegue de la automatización, permitiendo a los científicos de datos centrarse en sus responsabilidades principales. La plataforma redujo el esfuerzo necesario para desplegar y actualizar los modelos de aprendizaje automático de nuestro cliente de una semana y varios miembros del equipo, a sólo unas horas utilizando un proceso totalmente automatizado. Al final del proyecto, ya se habían desplegado en producción más de 50 nuevos modelos de aprendizaje automático.

Haga clic aquí para leer esto en inglés.