Accetal
Prestation à Nantes.
Le bénéficiaire souhaite une prestation d'accompagnement sur Nantes, dans le cadre de son programme d'accélération de l'IA., Cabinet de conseil
Nous accompagnons nos clients sur différents types de missions (depuis l'audit / choix de solution / expertise produits jusqu'à la mise en œuvre) autour de 3 pôles : * Architecture Entreprise & IT o Architecture SI o API Management (50% de notre activité) o Cloud / DevOps * Data Intelligence & Engineering o Architecture Big Data, o Data Virtualization o Data Gouvernance o Data Integration & Management o Data Visualization * Organisation & AMOA o Pilotage de projets & programmes o AMOA
MISSION
Contexte : Dans le cadre du chantier Knowledge Management (KM), une base de connaissance doit être constituée à partir de documents non structurés (PDF, Word, HTML).
Cette base servira à formaliser la connaissance sous une forme agnostique des usages, en vue d'une réutilisation large et durable.
Objectif de la mission : Concevoir un pipeline d'extraction, nettoyage et structuration de la connaissance textuelle issue de documents variés, en l'organisant dans un format pivot enrichi et exploitable.
Activités principales :
* Extraction du texte depuis des fichiers PDF, Word, HTML via des librairies adaptées
* Nettoyage et normalisation des contenus (suppression de bruit, OCR si nécessaire)
* Segmentation des textes en unités de connaissance structurées (sections, blocs)
* Enrichissement des unités avec des métadonnées (source, date, thème, typologie)
* Conception du format pivot (Markdown enrichi ou JSON) standardisé
* Documentation le format et les choix de structuration
* Collaboration avec l'équipe KM pour affiner la structuration
* Mise en place un script ou pipeline réutilisable pour de nouveaux documents
* Bonne connaissance de Domino Data Lab (optionnel)
PROFIL RECHERCHÉ
Non renseigné
Accetal
Nantes
Paiement horaire
400€ min - 400€ max
16/09/2025
Freelance