DESCRIPTION :
Dans le cadre de la mission d'intérêt général confiée par les pouvoirs publics, IFPEN concentre ses efforts sur l'apport de solutions aux défis sociétaux et industriels de l'énergie et du climat, au service de la transition écologique. Partie intégrante d'IFPEN, IFP School, son école d'ingénieurs, prépare les générations futures à relever ces défis.
Evaluation des méthodes d'IA générative à base de modèle de transport de type score diffusion, appliquées à la génération de champs de pression et de vitesse dans un écoulement turbulent par capteur
Les données de vitesse de vent sont indispensables pour l'optimisation dans le domaine des éoliennes, en permettant notamment de mieux prédire l'usure que subira une éolienne en fonction de ses caractéristiques et de son environnement. Ces données doivent être nombreuses, variées, et représentatives des épisodes climatiques qu'une éolienne affrontera, en fonction de son environnement climatique, de sa localisation géographique, ou des perturbations causées par d'autres éoliennes pouvant générer des perturbations difficiles à modéliser. Or, les campagnes d'acquisition de données par capteurs étant onéreuses et complexes à mettre en place, la quantité de données disponibles est fortement limitée.
Pour remédier à ce problème et étoffer ou se substituer aux jeux de données existants, de nombreuses méthodes de génération de vents synthétiques ont été développées pour simuler les propriétés physiques du vent. Cependant, le coût de calcul associé à ces méthodes grandit exponentiellement dès lors que l'on introduit des perturbations complexes. Ce coût élevé favorise en pratique des modèles plus simples et donc moins réalistes.
Une autre approche consiste à exploiter les outils statistiques en partant des données, plutôt que des modélisations physiques. Les mesures de vent sont alors modélisées comme une distribution de probabilité conditionnelle, qu'il s'agit alors d'estimer puis d'échantillonner pour générer les données à volonté. Pour garantir que ces outils de génération produisent des données réalistes, on utilise souvent des conditions (données acquises, contraintes physiques), pour guider la génération. Il est néanmoins important de vérifier que les bases de données générées explorent bien la distribution de probabilité attendue.
Les grandes avancées récentes dans le domaine de l'IA générative, notamment pour la génération de données séquentielles, fournissent un outil prometteur pour résoudre ce problème statistique.
Plusieurs architectures générales ont été adaptées pour le traitement spécifique des séries temporelles :
* Les GAN (Generative Adversarial Networks, Goodfellow et al., 2014), et leurs adaptations récentes aux transformers, comme le modèle MTS-GAN (Madane et al., 2024).
* Les modèles de diffusion (Sohl-Dickstein et al., 2015), adaptés aux séries temporelles dans des modèles récents tels que le SSSD (Alcaraz et Strodthoff, 2023), et Time Weaver (Narasimhan et al., 2024). Ces derniers modèles présentent des résultats prometteurs, notamment par leur capacité de généralisation et par le réalisme des données synthétisées.
En particulier, Time Weaver permet un contrôle fin dans le conditionnement des données générées, en intégrant plusieurs types de paramètres simultanément, qu'il s'agisse de variables catégoriques, continues, ou même de séries temporelles.
Objectifs
L'objectif de ce stage est de développer et d'évaluer un modèle de génération conditionnelle par méthode de diffusion, capable de générer des données de vent réalistes. L'accent sera mis sur l'analyse approfondie de sa capacité de généralisation, c'est-à-dire sa faculté à produire des séries qui recouvrent la distribution de probabilité sous-jacente aux données réelles, plutôt que copier les données originales.
Tâches :
* Prise en main des modèles classiques de génération conditionnelle par méthode de diffusion sur des jeux de données standards d'images 2D.
* En s'inspirant du modèle Time Weaver, mise au point d'un modèle génératif de diffusion adapté aux séries temporelles multivariées.
* Implémentation et application du modèle au cas d'usage de la génération conditionnelle de vitesses de vent.
* Analyse des conditions sous lesquelles le modèle est capable de généraliser et de produire des données réalistes et représentatives.
Code d'emploi : Ingénieur Méthodes (h/f)
Domaine professionnel actuel : Ingénieurs, Projeteurs et Techniciens de l'Industrie Chimique
Niveau de formation : Bac+5
Temps partiel / Temps plein : Plein temps
Type de contrat : Stage/Jeune diplômé
Compétences : Bases de Données, Generative AI, Curiosité, Mathématiques Appliquées, Mécanique des Fluides, Elaboration des Prévisions, Géométrie Euclidienne, Test d'Installation, Etudes et Statistiques, Compétences de Modélisation, Science des Données, Tâches de Conditionnement, Energie Eolienne
Courriel :
webmestre@ifpen.fr
Téléphone :
0147526000
Type d'annonceur : Employeur direct