DESCRIPTION :
En tant que stagiaire au CEA, vous aurez l'opportunité de travailler au sein d'un environnement de recherche de renommée mondiale. Nos équipes sont composées d'experts passionnés et dédiés, offrant un cadre propice à l'apprentissage et à la collaboration. Vous aurez accès à des équipements de pointe et à des ressources de recherche de premier ordre pour mener à bien vos missions.
Contexte
Les outils d'analyse de mise en page sont aujourd'hui performants pour les documents textuels (factures, formulaires), mais les cartes et plans posent encore de nombreux défis en raison de leur complexité graphique (symboles vectoriels, annotations textuelles, légendes, échelles, etc.).
Le logiciel MapLayoutParser, développé par le CEA LIST, constitue une solution innovante pour répondre à ces problématiques et ouvre la voie à des applications variées : intelligence géospatiale, urbanisme, numérisation d'archives, robotique.
Objectifs
Évaluer les performances actuelles de Map-Layout-Parser sur différents types de cartes et plans (architecturaux, topographiques, techniques).
Améliorer la robustesse du modèle par fine-tuning, augmentation de données et adaptation des classes cibles.
Développer des modules de post-traitement pour enrichir les résultats et faciliter leur exploitation.
Valider l'approche par des benchmarks et une étude de cas appliquée (ex. extraction automatique d'informations clés).
Missions principales
*
Analyse et évaluation des performances de l'outil sur divers jeux de données.
*
Mise en place de stratégies d'amélioration :
+
Fine-tuning sur jeux de données annotés,
+
Augmentation et génération de données,
*
Développement d'un module de post-traitement pour :
+
Regroupement sémantique des éléments,
+
Alignement texte-symbole (association étiquette-objet),
+
Export structuré en JSON ou graphes.
+
Validation expérimentale via benchmarks et étude de cas.
Compétences développées
*
Vision par ordinateur et deep learning appliqués aux documents complexes.
*
Traitement et augmentation de données annotées.
*
Développement d'algorithmes de post-traitement et structuration de données.
*
Évaluation et validation par benchmarks et cas d'usage concrets., Students in their 5th year of studies (M2)
*
Computer vision skills
*
Machine learning skills (deep learning, LLM, VLM, generative AI...)
*
Python proficiency in a deep learning framework (especially PyTorch or TensorFlow)
Rejoignez-nous, venez développer vos compétences et en acquérir de nouvelles !
Vous avez encore un doute ? Nous vous proposons :
* L'opportunité de travailler au sein d'une organisation de renommée mondiale dans le domaine de la recherche scientifique,
* Un environnement unique dédié à des projets ambitieux au profit des grands enjeux sociétaux actuels,
* Une expérience à la pointe de l'innovation, comportant un fort potentiel de développement industriel,
* Des moyens expérimentaux exceptionnels et un encadrement de qualité,
* De réelles opportunités de carrière à l'issue de votre stage
* Un poste au cœur de la métropole grenobloise, facilement accessible via la mobilité douce favorisée par le CEA,
* Une participation aux transports en commun à hauteur de 85%,
* Un équilibre vie privée - vie professionnelle reconnu,
* Un restaurant d'entreprise,
* Une politique diversité et inclusion,
Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes handicapées, cet emploi est ouvert à toutes et à tous. Le CEA propose des aménagements et/ou des possibilités d'organisation pour l'inclusion des travailleurs handicapés., Basé à Saclay (Essonne), le LIST est l'un des deux instituts de CEA Tech, la Direction de la recherche technologique du CEA. Dédié aux systèmes numériques intelligents, sa mission est de réaliser des développements technologiques de pointe pour le compte de partenaires industriels, afin de créer de la valeur.
Au sein du LIST, le Laboratoire de Vision et d'Apprentissage pour l'Analyse de Scènes (LVA) mène ses recherches dans le domaine de la vision par ordinateur et de l'intelligence artificielle pour la perception des systèmes intelligents et autonomes. Les thématiques de recherche du laboratoire incluent la reconnaissance visuelle, l'analyse des comportements et des activités, l'annotation automatique à grande échelle, ainsi que les modèles de perception et de décision.
Code d'emploi : Data Scientist (h/f)
Domaine professionnel actuel : IT R&D Professionals
Niveau de formation : Bac+4/+5
Temps partiel / Temps plein : Plein temps
Type de contrat : Stage/Jeune diplômé
Compétences : Intelligence Artificielle, Vision par Ordinateur, JSON, Python (Langage de Programmation), Analyse Syntaxique, Tensorflow, Pytorch, Large Language Models, Deep Learning, Generative AI, Anglais, Français, Développement Industriel, Recherche, Algorithmes, Implantation Aménagements Urbains, Gestion de la Performance, Etudes de Terrain, Systèmes Intelligents, Conception et Réalisation en Robotique, Recherche Technologique
Courriel :
internet.saclay@cea.fr
Téléphone :
0160833031
Type d'annonceur : Employeur direct