Au sein d'un grand groupe bancaire, une équipe Data & AI développe depuis 5 ans un jumeau numérique du système d'information : une représentation vivante et dynamique de l'infrastructure IT (serveurs, routeurs, applications, interconnexions) alimentée en continu par les données du terrain., L'équipe compte environ 22 personnes, dont 6 data scientists, 3 DevOps, un architecte et des profils ML. L'environnement est orienté R&D appliquée avec un impact direct sur la résolution d'incidents dans un système d'information bancaire de grande ampleur.
L'architecture repose sur une base graphe massive détenant la cartographie temps réel de l'infrastructure, ainsi que sur une plateforme agentique accessible aux collaborateurs via chatbot web et messagerie collaborative. Le projet entre en V3 avec deux chantiers principaux : la refonte du modèle de données de la base graphe pour corriger le legacy et la connexion des trois sources de données restantes. La mission s'inscrit dans un contexte de transformation et d'industrialisation de la plateforme data et graphe.
- Concevoir et maintenir les pipelines d'ingestion depuis les sources IT : Dynatrace, ServiceNow, Discovery, Kubernetes, Confluence, SharePoint, Jira.
- Connecter les trois sources de données restantes via API en coordination avec les équipes opérationnelles détentrices des données.
- Gérer les flux IT Data Capture, IT Event Capture et IT Doc Capture.
- Contribuer à la V3 du modèle de données TigerGraph en améliorant rétro-compatibilité et correction des erreurs structurelles héritées.
- Résoudre les problèmes de déduplication et modéliser des entités cloud dans le graphe.
- Optimiser les instances TigerGraph dans un environnement Kubernetes/IaaS interne.
- Expérience solide en bases de données graphe : Neo4j, Memgraph ou équivalent.
- Maîtrise avancée de Python pour pipelines d'ingestion et transformations.
- Expérience avérée en environnements Kubernetes en production.
- Compétences en gestion des problèmes complexes liés à la qualité des données : déduplication, normalisation.
- Montée en compétence sur GSQL prévue pendant la mission.
Collaboration avec des data scientists sur divers projets nécessitant l'accès à différentes sources. Participation active au projet GraphRAG assurant liaison entre base vectorielle interne et TigerGraph. Développement professionnel au sein d'un environnement technique complexe.
Partager cette mission via
Explore ces missions en lien avec tes compétences et ton expérience.