Contexte Dans le cadre de l'accélération de la mise à disposition des data, des KPI Performance et de leur qualité dans la plateforme digitale Supply Chain, la mission consiste à construire des pipelines de produits digitaux sources et/ou agrégés Supply dans la GCP (BigQuery). Le projet s'inscrit dans un contexte international, multi-BU, avec des couches sémantiques et dashboards en LookML et/ou PowerBI. En complément, l'intégration d'IA génératives et agents (CoPilot, Gemini, ChatGPT) est désormais intégrée dans les process Data.
* Construire des pipelines de données, de la source à la visualisation * Modéliser plusieurs types de Data products (Source Aligned, Agrégated, Couches Sémantiques) * Déployer les couches sémantiques en priorité sur les KPI Performance Supply * Participer à la qualité des données (Data Quality metrics) et aux objectifs FinOps (optimisation) * Remettre en cible technique certaines pipelines existantes à enjeu (Pipeline interne avec DBT, Terraform) et assurer optimisation, run, monitoring, alerting * Garantir l'accès qualitatif aux sources de données * Assurer la maîtrise de la donnée et garantir la qualité de son utilisation (référencement, normalisation, qualification) * Contribuer à la définition de la politique de la donnée et à la structuration de son cycle de vie en collaboration avec le Chief Data Officer * Superviser et intégrer des données de diverses natures provenant de sources multiples * Vérifier la qualité des données entrant dans le Data Lake (recette, suppression des doublons) * Capturer les données (structurées et non structurées) produites dans les différentes applications ou à l'extérieur de l'entité * Intégrer, structurer (sémantique, etc.), cartographier, nettoyer, valider les données * Éventuellement créer le référentiel de données Livrables * Modèle physique de données * Couche sémantique * Data Lake approprié, partagé et dimensionné * Cartographie des données * Éléments garantissant la qualité de la donnée
* GCP / BigQuery (confirmé - impératif) * Modélisation de données (confirmé - impératif) * PowerBI (confirmé - important) * Looker (confirmé - important) * Pipelines internes avec DBT, Terraform * LookML pour couches sémantiques * IA génératives et agents (CoPilot, Gemini, ChatGPT)
Partager cette mission via
Explore ces missions en lien avec tes compétences et ton expérience.