cover image
SOCOTEC

[STAGE] Data Scientist H/F

On site

Palaiseau, France

Internship

03-11-2025

Share this job:

Skills

Communication Python SQL GitLab Machine Learning PyTorch Scikit-Learn TensorFlow Deep Learning Computer Vision git AWS Numpy Pandas Data Science Langchain Keras Matplotlib NLP

Job Specifications

Description Du Poste

Au sein du groupe, vous rejoindrez le Data & IA Hub : le centre de compétences en Data & IA pour les 26 pays du groupe SOCOTEC. Le Hub suit une croissance forte des effectifs avec des projets en interne mais aussi auprès des clients du groupe.

Intégré à l’équipe du Data & IA Hub, vous rejoindrez une jeune équipe composée de Data Scientists, Data Engineers et ML Engineers.

Vous travaillerez sur deux missions principales :

En mode projet, vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement. Vous contribuerez au développement des 4 axes principaux du groupe :
Inspection 4.0 : développements d’algorithmes de computer vision et NLP en soutien aux experts métiers sur le terrain
Assistants SOCOTEC : développement d’agents personnalisés pour les services du groupe (RAG, text-to-SQL, …)
IA+X pour des nouveaux services : développement de technique d’hybridation entre physique et IA (jumeau numérique, PINN)
Extraction d’information à partir de documents et de plans
Vous choisirez un sujet de R&D pour vous confronter à l’état de l’art du domaine avec des possibilités de publication scientifique. Les sujets sont présentés et détaillés ci-après:
Inspection 4.0 : Machine learning appliqué à l'inspection des ouvrages d'art
Auto-completion de contenu technique pour la rédaction de rapports
Agents de Knowledge Management avec techniques RAG avancées
Smart speech-to-text avec extraction intelligente d'informations
Computer Vision: détection et classification de composants électriques

Le travail sera fait en collaboration avec une équipe de développeurs pour développer les modèles et héberger les livrables sur une plateforme web AWS.

Vous ferez preuve d’autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de son code.

Chez SOCOTEC, les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique, management d’une équipe (lead data), etc.

Vous aurez la possibilité d’interagir à l’international (US, UK, ITA, ESP, NL) et des opportunités de mobilité internationale sont possibles.

Le stage pourra être basé à Palaiseau ou à Lyon

Qualifications

Étudiant(e) en dernière année de Master en Data Science / Machine Learning ou école d’ingénieur avec spécialisation en data et intelligence artificielle.
Bonnes connaissances en statistiques, modélisation et analyse de données (analyse factorielle, régressions, clustering, etc.).
Bonne maîtrise du langage Python et de ses principales bibliothèques pour la data science (pandas, NumPy, scikit-learn, matplotlib).
Familiarité avec les bases de données relationnelles (SQL) et les environnements de développement collaboratif (Git, GitLab, Jupyter Notebooks).
Connaissances de base en algorithmes de machine learning et de deep learning, avec une première expérience sur un framework comme TensorFlow, Keras ou PyTorch.
Intérêt marqué pour les modèles de langage (LLMs) et l’IA générative : compréhension des principes de transformers, fine-tuning, embeddings et prompt engineering.
Une première expérience avec des outils ou bibliothèques comme LangChain serait un plus.
Connaissance des environnements cloud (notamment AWS : Lambda, S3, Timescale) appréciée.
Goût affirmé pour les technologies innovantes et l’expérimentation.
Curiosité scientifique et capacité à apprendre rapidement de nouveaux concepts.
Polyvalence, rigueur et autonomie dans la conduite des analyses.
Esprit d’équipe et aisance dans un environnement collaboratif.
Anglais courant et technique

About the Company

SOCOTEC has built its reputation over 70 years as an independent third party assisting companies in the areas of quality, health and safety, and the environment. Through its inspection and measurement, assistance and consultancy, and training and certification services, SOCOTEC helps to optimize the performance of companies in every sector by managing the risks inherent in their activities. Let's SOCOTEC With consolidated revenue of €1.2bn, operations in 27 countries, 200,000 clients, 12,500 employees and over 250 forms o... Know more