Machine Learning : industrialisation d’algorithmes pour une enseigne de grande distribution

[Secteur Grande Distribution] Contexte

Une enseigne internationale de la Grande Distribution a souhaité utiliser les données détenues par ses magasins localisés dans différents pays d’implantation, afin de les aider dans leur prise de décision à l’internationale.

Plus concrètement, Meritis est intervenue auprès d’une équipe de Data Scientists du groupe afin de développer des solutions de Machine Learning permettant de traiter de grands volumes de données, mais également afin d’accompagner cette équipe dans sa montée en compétences techniques.

Technologies utilisées

  • Scala,
  • Python,
  • Spark,
  • Kafka,
  • Tableau,
  • Jupyter,
  • BigQuery,
  • GCP,
  • AirFlow

Les objectifs techniques du projet

  • Industrialiser les POCs écrits en R vers spark (scala/python)
  • Challenger les data scientists vis-à-vis de leur modélisation
  • Faire monter en compétences les data scientists
  • Gestion de la plateforme Cloud hébergé chez Google
  • Reporting / Dashboards

Résultats

  • Segmentation de produits (Kmeans) => temps d’exécution réduit de 10h •
  • Segmentation de clients (régression logistique et Random Forest) => temps d’exécution réduit de 10h
  • Prévision de ventes (régression linéaire) => temps d’exécution réduit de 2h
  • Planification de trafic caisse (régression linéaire) => +4% sur la fiabilité du modèle
  • Diverses formations données aux data scientists (git, intégration continue, test, Spark, …)

Découvrez notre dossier d’expert