Non renseigné
Responsable de garantir la fiabilité des services, l?excellence opérationnelle et le respect des performances sur l?ensemble des environnements, en intégrant les pratiques SRE (Site Reliability Engineering) dans l?Agile Release Train et le cycle de livraison produit. Activités principales Définir, suivre et reporter les SLO (Service Level Objectives), SLI (Service Level Indicators) et error budgets afin de garantir une fiabilité mesurable par domaine applicatif Mettre en place et améliorer en continu les systèmes de monitoring, observabilité et alerting Superviser la mise en production des releases, en s?assurant de la stabilité via une coordination transverse (Produit & Tech) Gérer les incidents, les analyses de causes racines (RCA) et les post-mortems pour améliorer en continu Travailler avec les équipes plateforme (Core Platform, Observability, FinOps) pour : Améliorer la résilience Optimiser les coûts Maintenir les performances Reporter l?état de la fiabilité, les risques et plans d?amélioration aux responsables (Agile Release Managers, leadership) Participer activement à l?Agile Release Train en représentant la voix de la production et de la fiabilité
Expertise forte en SRE (Site Reliability Engineering) dans des environnements SaaS / cloud-native, Expérience solide en : Gestion d?incidents Post-mortem Préparation opérationnelle des releases Capacité à coordonner plusieurs équipes (Produit, Tech, Plateforme) Forte orientation : Performance Prévention des incidents Gouvernance opérationnelle
Partager cette mission via
Explore ces missions en lien avec tes compétences et ton expérience.