Nous recherchons un Administrateur plateforme Big Data (Cloudera Data Platform), Cabinet de conseil
CS GROUP SOLUTIONS est une société de conseil, prestataire de services en informatique et cabinet de recrutement. Spécialisée dans le placement de consultants experts dans le domaine des métiers de l'informatique. Nos chargés d'affaires définissent avec vous vos recherches, et vous proposent les meilleurs missions en adéquation avec vos compétences. Nous recrutons des profils informatiques à tous niveaux de responsabilité pour le compte d'entreprises utilisatrices, SSII et d'éditeurs de logiciels ... Nous sommes structurés en deux entités : -"Sociétés de Services", partenaire privilégié des clients grands comptes, nous sommes spécialisés dans la prestation de compétences IT en régie ou au forfait. -"Cabinet de Recrutement" , nous recherchons et recrutons des candidats tels que : ingénieurs d'études, consultants fonctionnels et/ou techniques, architectes, chefs de projet, etc. CS Group Solutions est spécialisé sur les compétences suivantes: - AS 400 -
ERP - Réseau et Sécurité - Infrastructure - Nouvelle Techno/Web - BI, Supply chain - Système et Bureautique - Mainframe - ...., New! Démarquez-vous en passant des tests de personnalité gamifiés. Lancez-vous dès maintenant, en découvrant les trois tests disponibles gratuitement!
Le client est doté d'une plateforme Big Data on premise, basée sur la suite Cloudera Data Platform.
Elle sert essentiellement aux besoins du Service Après-Vente de ses produits.
Les rôles de la DSI sur cette plateforme sont multiples :
* Développer les pipelines d'ingestion de nouvelles données
* Développer les pipelines de préparation des données
* Industrialiser les développements (ingestions, data preps, algorithmes)
* Assurer le bon fonctionnement technique de la plateforme
* Assurer le support aux utilisateurs en cas d'anomalie et de questions sur l'utilisation de la plateforme
La DSI souhaite renforcer son équipe d'administrateurs BigData grâce à une prestation d'assistance., La prestation consiste à assurer l'administration des plateformes BigData ainsi que le support aux utilisateurs tant sur les anomalies que sur les demandes de support à l'utilisation de la plateforme
En détail, l'ensemble des tâches des administrateurs sont les suivantes :
Exploitation de la plateforme :
* Configurer, surveiller et optimiser les systèmes de stockage et de traitement des données, tels que les clusters de serveurs et les bases de données distribuées. (Cloudera)
* Effectuer les taches de MCO quotidiennes (vérification de l'état des jobs et de la plateforme)
* Assurer la sécurité des données en mettant en place des mesures de protection, des politiques de contrôle d'accès et des stratégies de sauvegarde/récupération.
* Assurer l'ordonnancement des chaines d'ingestion et des analytiques tournant sur les plateformes
* Participer aux projets d'évolution des plateformes BigData
* Gérer la performance des plateformes Big Data.
* Participer à la maintenance des environnements en appliquant des mises à jour.
* Automatiser les tâches récurrentes à l'aide de scripts pour optimiser la gestion des systèmes.
* Produire et maintenir la documentation d'exploitation de la plateforme
* Contribuer à l'amélioration continue de l'exploitabilité et de la qualité de service de la plateforme
* Maintenir et améliorer les KPI de suivi du fonctionnement de la plateforme
Le livrable associé est la documentation à jour des dernières modifications de paramétrage de la plateforme.
Support aux utilisateurs
Support sur incident
Documentation technique et fonctionnelle de la plateforme
Suivi de l'activité de run et amélioration continue
* Linux (RedHat 8), Shell scripting
* Security (LDAP, Kerberos, SSL, IDM)
* Cloudera, HDFS, YARN, Hive, Oozie, Spark, Knox, Zeppelin, Nifi
* Centreon, Ansible
* Python et Scala sur environnement distribué.
* SQL
* Maitrise des systèmes d'informations et logiciels (outils bureautiques courants, SharePoint, Power BI, etc.), Compétences techniques nécessaires
* Linux (RedHat 8), Shell scripting
* Security (LDAP, Kerberos, SSL, IDM)
* Cloudera, HDFS, YARN, Hive, Oozie, Spark, Knox, Zeppelin, Nifi
* Centreon, Ansible
* Python et Scala sur environnement distribué.
* SQL
* Maitrise des systèmes d'informations et logiciels (outils bureautiques courants, SharePoint, Power BI, etc.)