Un groupe international de distribution recrute un SRE (Site Reliability Engineer) confirmé pour rejoindre son équipe. Le périmètre couvre la plateforme : API (Kong), Kafka (Confluent), échange de fichiers et ESB (WebMethods). Le rôle est un point d'entrée des sollicitations utilisateurs internes (BU, plateformes), avec une mission d'amélioration continue et d'automatisation.
* Analyser et résoudre les incidents complexes sur le périmètre Échanges * Identifier les incidents récurrents et construire des plans de remédiation avec les équipes produit * Traiter les demandes de service et assurer leur suivi via ServiceNow * Rédiger des procédures d'automatisation des demandes récurrentes * Contribuer à l'amélioration continue des produits (automatisation, observabilité) * Documenter et capitaliser sur les résolutions d'incidents
* SRE confirmé * Maîtrise des plateformes d'échanges : API (Kong), Kafka (Confluent), ESB (WebMethods) * Expérience en observabilité et monitoring : Datadog, Prometheus, Grafana, PagerDuty * Pratique Cloud et automatisation : GCP, Python, Go * Maîtrise IaC et orchestration : Terraform, Ansible, Helm, Kubernetes * Anglais professionnel courant * Profil autonome, proactif, orienté service client
Partager cette mission via
Explore ces missions en lien avec tes compétences et ton expérience.