cover image
Valeo

Stagiaire Recherche en Intelligence Artificielle / Apprentissage par Renforcement (F/H)

On site

Créteil, France

Internship

21-01-2026

Share this job:

Skills

Python Research PyTorch Deep Learning C++

Job Specifications

Valeo est une entreprise mondiale de haute technologie qui conçoit des solutions révolutionnaires pour réinventer la mobilité. Nous sommes un équipementier partenaire des constructeurs automobiles et des acteurs de la nouvelle mobilité dans le monde entier. Notre vision ? Inventer une mobilité plus verte et plus sûre, grâce à des solutions axées sur la conduite intuitive et la réduction des émissions de CO2. Nous sommes leaders dans nos domaines d'activité et reconnus comme l'une des plus grandes entreprises innovantes au monde.

Stagiaire Recherche en Intelligence Artificielle / Apprentissage par Renforcement (F/H)

Rejoignez la révolution technologique du véhicule autonome et connecté au sein de Valeo !

Leader mondial des aides à la conduite, Valeo réinvente la vie à bord du véhicule et révolutionne l’expérience de conduite. Des solutions de connectivité et de commande intérieure aux systèmes de détection, la division Valeo Brain du Groupe vise à rendre la mobilité plus sûre et plus intuitive.

Le Valeo Mobility Tech Center basé à Créteil (94) est le siège de la Division Valeo Brain. Ce centre de Recherche & Développement regroupe 1180 collaborateurs autour de la conception de systèmes avancés d’assistance à la conduite (ADAS), de solutions de connectivité, d’interfaces homme machine et de systèmes de surveillance de l’habitacle.

Nous recrutons un(e) Stagiaire Recherche en Intelligence Artificielle, plus spécifiquement en apprentissage par renforcement. Le stage proposé s'articule autour de la participation au Waymo Open Sim Agents Challenge (WOSAC), une compétition internationale qui établit l'état de l'art en matière de simulation comportementale. Le/La stagiaire aura pour mission d'explorer, d'implémenter et d'optimiser des algorithmes d'Apprentissage par Renforcement (RL) et d'Apprentissage par Imitation (IL) au sein du simulateur open-source de nouvelle génération PufferDrive. Ce projet s'inscrit en complémentarité avec les travaux internes de Valeo offrant une opportunité de contribuer directement à la communauté scientifique.

Vos missions ~

Prendre en main l'environnement de recherche ~ Maîtriser le simulateur PufferDrive et implémenter le pipeline d'évaluation et les métriques du challenge WOSAC.
Implémenter des modèles de référence (Baselines) ~ Entraîner et évaluer des premiers agents basés sur l'Apprentissage par Imitation (Behavior Cloning) et l'Apprentissage par Renforcement simple (PPO) pour établir un score de base.
Innover et optimiser les algorithmes ~ Concevoir des architectures avancées (Transformers, Graph Neural Networks) et explorer l'apprentissage Multi-Agents (MARL) pour améliorer le réalisme et la diversité des comportements simulés.
Analyser et valoriser les résultats ~ Mener des tests de robustesse (simulation en boucle fermée), rédiger un rapport scientifique et potentiellement soumettre un article à une conférence internationale (ex~ NeurIPS Workshop, ICRA).

À propos de vous ~

Vous êtes passionné(e) par l'IA et souhaitez contribuer à définir la mobilité de demain au travers d'un sujet à la frontière entre ingénierie logicielle et recherche théorique.

Formation ~ Étudiant(e) en Master 2 Recherche ou en dernière année d'École d'Ingénieur avec une spécialisation en Mathématiques Appliquées, IA ou Robotique.
Compétences Techniques ~
Maîtrise impérative de Python et connaissances en C++.
Expérience solide avec un framework de Deep Learning (PyTorch).
Expertise IA ~ Connaissance théorique (MDP, Bellman) et pratique des algorithmes d'Apprentissage par Renforcement (PPO, SAC, TD3). L'usage de librairies comme Stable Baselines 3 ou Ray RLLib est un plus.
Savoir-être ~ Autonomie, rigueur scientifique et capacité à appréhender des concepts abstraits complexes.

Nos avantages ~

Présence d’un comité social & économique (CSE) ~ voyages, activités sociales et culturelles
Remboursement transport à hauteur de 70%

Pourquoi Valeo ?

Pour rejoindre un leader technologique et industriel, pionnier français dans l’innovation automobile
Pour une carrière dynamique avec des opportunités de CDI, de thèse ou de Volontariat International en Entreprise (Programme VIE)
Pour contribuer au développement d’une mobilité plus propre, plus sûre et plus intelligente

Valeo accorde une grande importance à la diversité, qu’elle soit culturelle, intergénérationnelle, de genre ou qu’elle concerne les personnes en situation de handicap.

Position~

R&D Trainee/Apprentice/VIE

Département~

Software

Schedule~

Temps plein

Employee Status~

Stagiaire (Fixed Term) (Trainee)

Type de contrat~

Stagiaire rémunéré

Job Posting Date~

2025-12-08

Join Us !

Being part of our team, you will join~

one of the largest global innovative companies, with more than 20,000 engineers working in Research & Development
a multi-cultural environment that values diversity and international collaboration
more than 100,000 colleagues in 31 countries... which make a lot of opportunity for career growth
a business highly committed

About the Company

As a technology company and partner to all automakers and new mobility players, Valeo innovates to make mobility cleaner, safer and smarter. Valeo is a technological and industrial leader in electrification, driving assistance systems, reinvention of the interior experience and lighting everywhere. These four areas, vital to the transformation of mobility, are the Group's growth drivers. Valeo in figures: 20 billion euros in sales in 2022; 109,900 employees at December 31, 2022; 29 countries, 183 plants, 21 research centers,... Know more