MATCHING | INSCRIPTION

Mission Freelance Data Scientist / Data Analyst Expert Vertex Et Gcp - Paris - Temps partiel (≤ 32 heures)

Freelance.com

100 - 249 salariés
Cabinet de recrutement / placement
Sourcing et portage salariale. Nous structurons et sécurisons la rencontre entre les entreprises et les travailleurs indépendants de talent. Dans un monde où tout va plus vite, les modèles traditionnels de travail sont de moins en moins adaptés. C'est pourquoi nous voulons aider les entreprises à accéder facilement et rapidement à la communauté des freelances, dans un cadre sécurisé et avec des coûts maîtrisés., New! Démarquez-vous en passant des tests de personnalité gamifiés. Lancez-vous dès maintenant, en découvrant les trois tests disponibles gratuitement!

MISSION

L'équipe IA SFR Analytics se dote d'un nouvel outil d'entraînement, de serving et de monitoring de ses modèles. Cet outil, nommé "Plateforme MLOps" en interne, doit être livré en juin et s'appuyer sur un panel de services proposés à la fois par GCP et par l'IT SFR.

Plus précisément, les technologies utilisées par la plateforme seront :
- GCP Workstations : l'environnement de développement - notebooks/Rstudio Server/codeOSS Server
- GCP Bigquery
- GCP GCS
- GCP Vertex
- SFR Gitlab
- SFR Harbor (container registry)
- SFR Nexus (package manager)
- SFR Airflow (ordonnanceur)

La plateforme MLOps comprendra deux modes d'utilisation :
- Portage d'applications existantes
- MLOps mainstream GCP

La mission actuelle vise à :
- recetter la plateforme dans son volet de portage
- démarrer la migration des projets de Data Science SFR Analytics sur cette plateforme de portage

A date, l'équipe administre trois serveurs physiques on-prem et y fait tourner l'ensemble de ses projets de data science. Les technos utilisées pour chaque étape du workflow de ML sont détaillées ci-dessous :
- Analyse exploratoire / entraînement de modèles :
- Le data scientist démarre un container docker sur l'un des serveurs linux.
- Ce container expose un Rstudio server (équivalent notebook) auquel le data scientist se connecte.
- A partir de cet environnement de travail, le data scientist peut :
- installer de manière persistante les packages R/Python dont il a besoin pour son projet
- se connecter à notre DWH Bigquery pour requêter, récupérer ou y remonter des données
- exploiter de manière non capée les cpus et la ram de la machine hôte
- entraîner des modèles
- analyser leur performance
- sauvegarder sur disque persistant le ou les modèles retenus ainsi que la base d'apprentissage et les fichiers de QOD associés (distributions des variables de la base d'apprentissage)
- préparer le ou les scripts d'inférence du modèle, qui, au sein d'un container similaire, loaderont le modèle sauvegardé, réaliseront l'inférence en batch, et remonteront les outputs du modèle (probas et métriques de QOD des variables d'entrée notamment) sur Bigquery et/ou sur fichiers locaux
- pusher son code sur un serveur Gitlab on-prem pour partage et versioning
- Inférence du modèle :
- Un container identique au container d'apprentissage mais dépourvu de Rstudio server est démarré de manière automatique par un worker Airflow afin de réaliser un batch d'inférence. Les dossiers contenant les packages, les scripts et les artefacts nécessaires à l'inférence sont montés au run dans le container.
- Le container exporte ses résultats (probas et métriques de QOD des variables d'entrée notamment) sur BigQuery et/ou sur disque.
- Monitoring :
- Une application R shiny portée par un shiny-server accède aux fichiers locaux et/ou aux données remontées sur Bigquery par les jobs d'inférence et affiche :
- le suivi des distributions des inputs du modèle
- l'évolution des performances à froid du modèle (dans le cas des modèles supervisés et une fois que l'on dispose de suffisamment de recul temporel)

Dans le fonctionnement en mode "portage", les modifications sont les suivantes :
- Analyse exploratoire / entraînement de modèles :
- le container de développement / exploration / training ne tourne plus sur nos machine on-premise mais sur GCP workstations
- il ne sert plus uniquement une interface Rstudio Server mais également un jupyterlab et un code-oss (au choix du data scientist)
- les artefacts, dont les binaires de modèles entraînés, les packages installés et les autres fichiers créés depuis notre IDE web ne sont plus stockés sur nos serveurs mais sur un bucket GCS
- le lien vers Gitlab demeure fonctionnel pour le versioning des codes, mais Gitlab devient également responsable du déploiement du traitement d'inférence :
- dans un projet GCP "lab" dédié au prototypage, accessible depuis les workstations et depuis la chaîne de ci Gitlab.
- dans un projet GCP "run" dédié à la production, accessible uniquement par la ci/cd Gitlab.
- Inférence du modèle :
- le container exécutant le traitement batch reste démarré par un appel du serveur Airflow, mais le service Airflow SFR Analytics est remplacé par le service Airflow de l'IT SFR
- le container n'est donc plus démarré sur nos serveurs mais sur un Cloud Run en mode job
- ce Cloud Run peut être rattaché aux environnements "lab" ou "run"
- Monitoring :
- l'application shiny de monitoring n'est plus servie par un shiny-server on prem mais est conteneurisée et portée par un Cloud Run tournant en mode service
- l'application shiny de monitoring ne lit plus ses données depuis les disques de nos serveurs mais depuis le dataset Bigquery et/ou le bucket GCS où elles sont stockées
- de même, le Cloud Run exécutant le shiny peut être rattaché aux environnements "lab" ou "run"
Comme dit en introduction, la mission consiste à :
- recetter le fonctionnement de la plateforme MLOps en mode portage : fonctionnalités détaillées ci-dessous
- démarrer la migration des projets de data science SFR Analytics sur cette plateforme de portage. Par migration des projets de data science existants, on entend le portage des étapes
- d'analyse
- d'entraînement/test/validation des modèles
- de mise en production
- et de monitoring des modèles

ces deux objectifs peuvent être menés conjointement, la migration des use-cases existants représentant une opportunité de recette en elle-même.

La recette inclut notamment les points suivants :
- recette de la workstation :
- de ses configurations et containers préparamétrés, qui doivent notamment :
- proposer :
- un ide fonctionnel : Rstudio server, jupyterlab ou code-oss au choix du datascientist
- tout le socle permettant l'utilisation des binaires métiers (Python, R, Java, git) ainsi que l'installation / compilation des packages requis par le projet
- être démarrés avec :
- un montage fuse d'un ou plusieurs buckets GCS en guise de stockage persistant non rattaché à la VM sous-jacente
- une authentification GCP héritée de la connexion aux workstations via la console GCP
- être connectés à :
- Bigquery
- GCS
- Cloud Run
- Gitlab
- Harbor
- Nexus
- de la possibilité de proposer des merge requests sur le repo Gitlab des images docker accessibles par la workstation
- ainsi que sur le repo des configuration des clusters de workstations (terraforms)
- recette des templates de ci Gitlab de la plateforme, qui doivent notamment permettre de :
- builder les images docker d'inférence et de monitoring
- créer / modifier les dags exécutés par le serveur Airflow
- recette du fonctionnement d'Harbor (container registry) :
- check que GCP workstations et Cloud Run se connectent bien à Harbor
- check que Gitlab peut pusher les images qu'il a buildées sur notre repo Harbor
- recette du fonctionnement de Nexus (package manager) :
- check du bon fonctionnement en tant que proxy des principaux repos publics (conda, pypi, cran, posit package manager, huggingface notammment), tant en lab qu'en run
- recette du fonctionnement de Airflow (sur l'environnement de run) :
- check de la bonne exécution des dags
- check de la bonne récupération des logs de tâches GCP dans l'UI Airflow
indispensable:
'- bonne maîtrise du workflow des projets de machine learning
- maîtrise de git et de la chaîne de ci/cd gitlab
- maîtrise de docker
- maîtrise de l'écosystème GCP, et particulièrement des services mentionnés dans la section "cadre et environnement" (les certifications GCP seront un plus)
- connaissance du langage R
-expérience de développement de modèles de machine learning
Souhaite
'Datascience : analyses descriptives multi variées - recommandations métier issues de ces analyse, La plateforme MLOps comprendra deux modes d'utilisation :
- Portage d'applications existantes
- MLOps mainstream GCP

La mission actuelle vise à :
- recetter la plateforme dans son volet de portage
- démarrer la migration des projets de Data Science SFR Analytics sur cette plateforme de portage

A date, l'équipe administre trois serveurs physiques on-prem et y fait tourner l'ensemble de ses projets de data science. Les technos utilisées pour chaque étape du workflow de ML sont détaillées ci-dessous :
- Analyse exploratoire / entraînement de modèles :
- Le data scientist démarre un container docker sur l'un des serveurs linux.
- Ce container expose un Rstudio server (équivalent notebook) auquel le data scientist se connecte.

PROFIL RECHERCHÉ

'- bonne maîtrise du workflow des projets de machine learning
- maîtrise de git et de la chaîne de ci/cd gitlab
- maîtrise de docker
- maîtrise de l'écosystème GCP, et particulièrement des services mentionnés dans la section "cadre et environnement" (les certifications GCP seront un plus)
- connaissance du langage R
-expérience de développement de modèles de machine learning

Environnement de travail

L'équipe IA SFR Analytics se dote d'un nouvel outil d'entraînement, de serving et de monitoring de ses modèles. Cet outil, nommé "Plateforme MLOps" en interne, doit être livré en juin et s'appuyer sur un panel de services proposés à la fois par GCP et par l'IT SFR.

Plus précisément, les technologies utilisées par la plateforme seront :
- GCP Workstations : l'environnement de développement - notebooks/Rstudio Server/codeOSS Server
- GCP Bigquery
- GCP GCS
- GCP Vertex

DETAIL DE L'OFFRE

Partager cette mission via

MISSIONS SIMILAIRES
POUR VOUS

Spa Praticien (Ne)

Dans un souci d'accessibilité et de clarté, l'écriture inclusive n'est pas utilisée dans cette annonce. Les termes employés au masculin se réfèrent aussi bien au genre féminin que masculin. Vos responsabilités : Votre mission principale sera la prise en charge des clients pour pratiquer les soins de notre spa, soins du visage et soins du corps avec les marques Absolution et Sarmance. Liste de tâches non exhaustives. Afin d'assurer la satisfaction client, le salarié pourra être amené à réaliser d'autres tâches relevant de sa qualification en fonction des nécessités de service. Votre profil : Savoir-être : -Vous partagez nos valeurs : agilité, convivialité et engagement -Vous êtes autonome et avez envie de gagner en responsabilité Savoir et Savoir-faire : -Vous avez une appétence ou connaissance du milieu de l'hôtellerie Nous vous offrons : -Type de contrat / durée : freelance, sur facture en auto-entreprise ou société, ou contrat d'extra -Date de démarrage : ponctuellement, sur demande, selon l'activité du spa. Nous cultivons un environnement de travail où la convivialité naît de la diversité des profils et des expériences. Nous valorisons chaque idée, afin que chacun apporte sa contribution unique à notre aventure collective. Vous vous reconnaissez dans nos valeurs de convivialité, d'engagement et d'agilité, et souhaitez participer à une véritable aventure ? N'hésitez plus, adressez-nous votre CV !

Services Aux Particuliers
POSTULER

Architecte Infrastructure

Dans le cadre d'un renfort d'équipe, nous recherchons pour notre client un Architecte Infrastructure H/F. La mission consiste principalement à cadrer les projets techniques adressés aux équipes d'infrastructure, accompagner la croissance des métiers, contribuer aux projets techniques et métiers en collaboration avec les équipes serveurs, réseaux, stockage, sécurité et DevOps. L'objectif est d'accompagner les responsables de projet dans la phase d'élaboration de manière à s'assurer que l'ensemble des prérequis techniques nécessaires à la phase de construction sont bien conformes aux règles d'architecture de l'entreprise. Le rôle de l'architecte : * Coordonner les différentes expertises techniques (réseau, stockage, sysadmin, expert virtualisation) lors de la phase d'élaboration des solutions techniques. * Challenger les experts techniques et métiers avec un esprit critique et constructif. * Participer à la résolution des problèmes * Piloter des projets

Technologies de l'Information et de la Communication
POSTULER

Business Analyst Pega

Nous recherchons un Business Analyst expérimenté pour renforcer l'équipe en charge du socle de Case Management basé sur la solution PEGA. Missions : * Accompagner les métiers dans l'expression et le suivi des besoins. * Assurer la coordination des demandes métiers et IT sur le périmètre Case Management. * Organiser et animer les comités de suivi et de maintenance. * Participer à la conception fonctionnelle (rédaction des spécifications). * Rédiger et exécuter les cahiers de recette. * Contribuer à la gestion du changement et au suivi des mises en production. * Produire les livrables fonctionnels (analyse de risques, conception, cahier de recette)., (encadrement par des experts, échanges sur les bonnes pratiques, favoriser l'innovation...) * Une entreprise reconnue "Great Place To Work" * Des évènements et séminaires inoubliables, des soirées d'agence conviviales 𝐌𝐎𝐁𝐈𝐋𝐈𝐓𝐄 Une mobilité nationale et internationale pour vous accompagner dans vos projets de vie. 𝐃𝐈𝐕𝐄𝐑𝐒𝐈𝐓𝐄 Le Groupe JEMS porte fièrement sa valeur "Diversité" en se mobilisant pour l'inclusion et l'égalité des chances et en luttant contre toutes formes de discrimination. Tous nos postes sont ouverts aux personnes en situation de handicap. 𝐋𝐄𝐒 𝐕𝐀𝐋𝐄𝐔𝐑𝐒 𝐉𝐄𝐌𝐒 Les valeurs représentent le savoir être de l'entreprise. Elles sont fondamentales car elles décrivent notre approche du travail ainsi que les conditions de vie chez JEMS. Nous en avons quatre : l'engagement, l'agilité, l'audace, la diversité

Direction des Secteurs Privé et Publique
POSTULER

Directeur / Chef De Projet Senior

Au sein de la DSI d'un grand laboratoire pharmaceutique international, vous aurez la responsabilité du pilotage de projets IT stratégiques dans les domaines R&D et Industrie. Vos missions couvrent le cadrage des besoins, la planification, la gestion budgétaire et le suivi des risques. Vous serez amené(e) à animer les comités de pilotage (COPIL, COPROJ), assurer la communication auprès des parties prenantes et garantir la bonne application de la méthodologie interne. Vous interviendrez dans un environnement hautement réglementé et exigeant, où rigueur, qualité et respect des délais sont essentiels. Ce rôle vous permettra d'être un acteur clé dans la réussite de projets à forte visibilité, en contribuant directement à la transformation digitale et technologique du groupe.

Direction des Secteurs Privé et Publique
POSTULER

DÉCOUVREZ CES MISSIONS
POPULAIRES

Formateur / Formatrice En Logistique

* Adaptation des contenus aux apprenants * Animation de groupes * Animer des sessions de formation * Encourager la participation de chaque membre du groupe * Gérer les supports de formation

Education, Formation et Recherche
POSTULER

Formateur Basé En Idf Management Et Soft Skills

Une idée simple, rejoignez le CLUB. il est fait pour vous si vous : * êtes titulaires d'un titre de formateur d'adulte * êtes basé en IDF (aucun recrutement de formateur basé en province ne se étudié) * animez des formations en management, relation client, communication écrite et orale ou efficacité professionnelle * souhaitez bénéficier de formation, d'analyse de pratiques, d'un accompagnement personnalisé * souhaitez disposer d'un volume d'activité qui sécurise votre activité Nous sommes à votre disposition pour vous présenter plus spécifiquement notre partenariat CLUB !

Education, Formation et Recherche
POSTULER

Formateur En Management

Le CFA recherche pour son équipe un·e formateur·trice en management pour nos BTS MCO , pour un volume de 100 heures. Ce poste est aussi ouvert aux formateurs auto-entrepreneurs. Formation des apprenant·e*·s* : * Concevoir, préparer et animer les séances pédagogiques en accord avec les référentiels et dans le respect de la démarche qualité * Mettre en place le déroulé et le suivi pédagogique du programme * Concevoir des outils pédagogiques et supports adaptés en présentiel et en distanciel * Evaluer le niveau des apprenant·e·s et leur besoin individuel de formation pour une pédagogie différenciée * Evaluer l'acquisition des compétences tout au long du parcours éducatif * Veiller sur les dernières tendances d'enseignement et les évolutions de programmes

Education, Formation et Recherche
POSTULER

Professeur Tourisme

* Vous assurerez la préparation du contenu pédagogique et l'animation des cours : * Les thématiques principales en 1ère année sont les suivantes : * Les éléments fondamentaux d'une veille informationnelle. * Les éléments fondamentaux de l'environnement numérique. * La mise à jour d'une base d'information touristique. * Comment prioriser le (s) message (s) à communiquer dans une stratégie. * Les outils bureautiques et multimédias. Outils de traitement d'enquête. * Les éléments fondamentaux de la sécurisation du SIT., * Mettre en place des pédagogies actives : cas pratiques, projets, simulations professionnelles. * Évaluer les compétences acquises par les étudiants à travers des projets, examens et soutenances. * Collaborer avec l'équipe pédagogique pour assurer le suivi des étudiants et l'amélioration continue des enseignements., * Participer à la formation de futurs professionnels du tourisme * Intégrer une école dynamique et tournée vers l'employabilité, * Transmettre vos savoirs et expérience à des groupes de faible effectif (max 15 élèves par classe) * Évoluer dans un environnement innovant et en constante évolution.

Education, Formation et Recherche
POSTULER