Non renseigné
Configuration et gestion de l'infrastructure cloud (Lambda) pour l'accès GPU des équipes ML. Vous mettrez en place des bonnes pratiques FinOps et protégerez contre les erreurs critiques. L'optimisation des images Docker pour réduire les temps de cold start fait également partie de vos responsabilités. Vous maintiendrez les systèmes de monitoring des entraînements de modèles et contribuerez aux projets ML Platform sur AWS, notamment en CI/CD et tooling. Votre impact inclut l'amélioration de la productivité des équipes ML, la garantie de robustesse et scalabilité des environnements d'entraînement, ainsi que le renforcement de la sécurité.
- Configurer et gérer l'infrastructure cloud pour l'accès GPU.
- Mettre en place des pratiques FinOps.
- Optimiser les images Docker.
- Maintenir les systèmes de monitoring.
- Automatiser les processus et améliorer continuellement les workflows.
- Renforcer la sécurité via audits et gestion des risques.
- Expérience confirmée en DevOps / Cloud Engineering (5+ ans).
- Expertise en AWS & Terraform.
- Solide maîtrise de Docker dans un environnement complexe.
- Compétences avec GitLab CI / Jenkins, Linux/UNIX, Monitoring & observability.
- Autonomie, esprit collaboratif, capacité à challenger les solutions proposées.
Possibilité d'évoluer dans un environnement dynamique où vous aurez accès à une formation continue sur les nouvelles technologies. Une culture orientée vers l'amélioration constante est encouragée au sein du groupe.
Partager cette mission via
Explore ces missions en lien avec tes compétences et ton expérience.