Au sein de l'équipe Data & AI d'un grand groupe pharmaceutique international, vous renforcez une équipe produit qui conçoit et opère des solutions data pour accélérer la R&D et les essais cliniques. Vous intervenez sur la conception, la livraison et le run de pipelines de données en production sur une plateforme cloud de grande échelle.
* Concevoir et implémenter des pipelines end-to-end (ingestion DWH / Datamart) sur Snowflake avec dbt, Airflow, SQL et Python * Contribuer à la modélisation DWH/Datamart avec un focus sur la performance des requêtes et l'efficacité des workloads * Traduire les besoins métier (Product Owners, Data Analysts, Data Scientists) en solutions techniques avec des contrats d'interface clairs * Mettre en place la qualité de données, l'observabilité et le monitoring (Datadog / Grafana) * Opérer le run quotidien des flux existants, gérer les incidents et suivre les KPIs opérationnels * Appliquer les bonnes pratiques CI/CD, versioning, IaC et conteneurisation (GitHub Actions, Terraform, Docker) * Produire la documentation technique et fonctionnelle, participer aux code reviews * Contribuer aux pratiques MLOps pour délivrer de la data AI-ready aux applications downstream
* Apache Airflow (orchestration) * Python + SQL, * 5 ans d'expérience minimum en tant que data engineer * Snowflake + dbt : maîtrise avancée, expérience en modélisation et transformation en production * Apache Airflow : orchestration de pipelines complexes en environnement production * Python + SQL : niveau confirmé, écriture de scripts d'ingestion et de transformation * AWS : usage production (S3, services managés cloud) * CI/CD & IaC : GitHub Actions, Terraform, Docker - bonnes pratiques appliquées en production * Monitoring & qualité data : Datadog et/ou Grafana, alerting, tests de données
Partager cette mission via
Explore ces missions en lien avec tes compétences et ton expérience.