Non renseigné
Département ou Service : Département Data Conditions de travail : Présentiel 3 jours par semaine minimum Objectif de la mission : sous la supervision du System Architect AI, le rôle principal est de concevoir, de mettre en œuvre et de faire évoluer les assets Gen AI sur une plateforme hybride GCP/Microsoft, en visant évolutivité et performance. Le candidat doit garantir la cohérence technique, la scalabilité et la robustesse des solutions d'IA Générative et être un référent sur les architectures LLM. Les tâches incluent : * Architecture Gen AI : Conception d'architectures découplées, scalables et sécurisées (RAG, Agents autonomes), définition de l'architecture applicative des environnements LLM (DEV, UAT, PROD) et intégration CI/CD via LLMOps. * Développeur Augmenté : Une expérience prouvée dans les solutions de "Développeur Augmenté" est requise pour mener à bien une partie des tâches du poste. * Gouvernance et Dette Technique : Mise en application des principes de gouvernance de l'IA et gestion de la dette technique. * Architectures Robustes : Conception d'architectures robustes et tolérantes aux pannes, rédaction de contrats d'interface, développement de processus de fallback et gestion des exigences non fonctionnelles (latence, sécurité, fiabilité). * Modèles d'Interaction et d'Ingestion : Définition de modèles optimisés, analyse des besoins métiers, création de modèles conceptuels pour le stockage vectoriel, optimisation des tokens LLM, collaboration avec les équipes de développement et mise en place de mécanismes d'évaluation continue.
Les spécificités & connaissances attendues sur GCP, LLMOps & Architectures Cognitives : * Maîtrise de l'orchestration et du Function Calling : Expérience prouvée dans le découplage de la logique métier pour interagir dynamiquement avec le Système d'Information, garantissant un code modulaire et réutilisable (Python, Go, etc.). * Écosystèmes GCP & Microsoft IA : Connaissance approfondie de Agent Platform (ex-Vertex AI), Gemini et de la plateforme Microsoft équivalente. Capacité à sélectionner les modèles adéquats selon le rapport coût/performance/complexité et à évoluer dans un environnement cloud multi-modèles. * Conception avancée pour les forts volumes et cas d'usage complexes : + Gestion de bases de données vectorielles à l'échelle (Vector Search). + Stratégies avancées de mise en cache sémantique pour réduire la latence et les coûts. + Maîtrise des architectures par Agents (multi-agents, planification, réflexion). * Prendre en compte les besoins de sécurité liés à la Gen AI : * Connaissance des stratégies de prévention des attaques de type Prompt Injectionou Data Poisoning. * Mise en place de filtrages stricts (OLS/RLS sémantique) pour garantir que les LLMs ne restituent que les données auxquelles l'utilisateur a accès. * Assurer l'observabilité et le monitoring (LLMOps) : Connaissance des best practices pour monitorer les chaînes applicatives IA (traçabilité des prompts, temps de réponse, coûts par token) ainsi que la diffusion des logs vers les couches de Sécurité des SI (SIEM). Les livrables comprennent la documentation des exigences, les spécifications techniques, la communication des décisions techniques, le support aux équipes et la rédaction de documentation technique (diagrammes d'architecture, spécifications de pipelines LLMOps).
Partager cette mission via
Explore ces missions en lien avec tes compétences et ton expérience.