Mission Freelance Dataops / Mlops / Ia
Nous recherchons un profil type architecte DataOps, MLOps, AI pour participer au design technique, à l'implémentation en production, à l'industrialisation, et au support et à l'amélioration continue des produits et services d'IA pour les métiers et fonctions du groupe Vous travaillerez avec le front sur :
* L'élaboration, la mise en production, l'amélioration continue et le support opérationnel des fonctionnalités à valeur ajoutée autour des produits et services du Datalab : APIs, workflows MLOps, pipelines, dashboards, etc. You build it, you run it!
* Participer au maintien en conditions opérationnelles, à la supervision et à la fiabilisation des 15+ plateformes de Data Science de Production du Groupe
* Mettre en place les outils et bonnes pratiques, et accompagner les clients dans les démarches MLOps / LLMOps autour de ces outils.
* Accompagner les utilisateurs dans l'utilisation de frameworks de calcul distribué et/ou d'accélérateurs de calcul hardware (GPU).
* Renforcer les équipes de Support et d'accompagnement N3 du DataLab sur les plateformes et outils d'IA du groupe (best practices, mentoring, etc). Environnement technique de l'équipe Front
* Docker / Kubernetes / OpenShift
* Frameworks de calculs distribues (Spark, Ray, Dask, OpenMPI)
* GPU Computing (CUDA, Rapids, NIMs, Nemo)
* Environnements de Data Science Python, Conda, R (opt.)
* Programmation en python
* Shell scipting
* MLFlow / KubeFlow
* Outils de CI/CD DevSecOps/GitOps : Hashicorp Vault, Gitlab, Gitlab-CI, Artifactory, ArgoCD, Argo Workflow, Notre équipe est passée de 4 à 15 personnes en 2ans et nous passons à 20 cette année. Elle est séparée en 3 « mini-équipes » :
* Front / AI Competency Center : Assurent le développement des solutions à offrir as-as-service et l'accompagnement des utilisateurs.
* Automation : Pratiques DevSecOps / GitOps. / MLOps / LLMOps
* GPU Grid System : Assurent l'administration des systèmes et un grid de GPU on premises
… Et un PO Nous travaillons de pair avec :
* Une équipe de DevOps pour les outils de plateformes (Vault, SSO etc...)
* Une équipe de SRE pour les plateformes d'infra
* Une équipe qui supporte le Datalake (Trino, Spark, et Minio)
Environnement de travail
Technologies de l'Information et de la Communication