Data Engineer Senior - Freelance

Sur siteAutreTarif à négocier

Détails de l'offre

SECTEURTechnologies de l'Information et de la Communication

FRÉQUENCEAutre fréquence de paiement

LIEU91182, 91000 Évry-Courcouronnes

TYPE DE CONTRATFreelance

TEMPS DE TRAVAILHoraires de travail réguliers

LANGUESFrançais / Anglais

COMPÉTENCES

HTML, APIs, Airflow, Analyse des Données, Elasticsearch, Python (Langage de Programmation), PostgreSQL, Analyse Syntaxique, Structured Query Language (SQL), Données non Structurées, Gitlab ci, Moteurs de Recherche, Docker, Modélisation des Données, Qualité des Données, Traçabilité, Commerce de Détail, Contrôle Qualité

Collective

Pourquoi cette mission

Non renseigné

Présentation de la mission

Concevez et industrialisez la chaîne d'ingestion, de normalisation et de structuration des données externes dans une solution Data & IA. Le rôle implique de garantir la qualité des données, la robustesse des pipelines, la traçabilité des traitements et l'exploitabilité des flux pour les briques analytiques. Ce poste requiert 5 à 10 ans d'expérience avec une forte autonomie.

Missions principales

- Développer des pipelines d'ingestion automatisés.

- Concevoir et implémenter des connecteurs vers des sources externes.

- Gérer le parsing documentaire (découpage, nettoyage, structuration).

- Mettre en place des mécanismes de déduplication et de contrôle qualité.

- Concevoir les modèles de données intermédiaires et normalisés.

- Collaborer avec les équipes IA/NLP pour rendre les données exploitables.

- Participer aux tests, à la documentation et à la fiabilité des traitements.

Profil recherché

- Maîtrise avancée du Python.

- Conception de pipelines de données et orchestration.

- Compétences en APIs, scraping raisonné, parsing documentaire (PDF, HTML…).

- Expertise en SQL et modélisation de données sur PostgreSQL.

- Culture forte en qualité des données incluant logs et monitoring, tests et industrialisation.

- Gestion efficace des problématiques liées à volumétrie, erreurs et supervision.

- Expérience avec Airflow ou Prefect ou équivalent.

- Utilisation de librairies pour le parsing documentaire (PyMuPDF, pdfplumber, OCR…).

- Connaissance d'Elasticsearch pour l'indexation et le moteur de recherche.

- Familiarité avec Docker et GitLab CI/CD.

Ce que nous offrons

Nous proposons un environnement propice au développement professionnel grâce à une culture axée sur la qualité. Les candidats auront accès à diverses formations techniques adaptées aux enjeux actuels du secteur. L'équipe valorise également l'autonomie dans le travail tout en soutenant les projets individuels par un suivi régulier.

Partager cette mission via