cover image
BLUETHINK

AI Scientist – Modèles Tabulaires F/H

Hybrid

Paris, France

€ 130,000 /year

Full Time

28-12-2025

Share this job:

Skills

Python SQL Training Machine Learning PyTorch git C++ Data Science

Job Specifications


Vous rejoignez une entreprise technologique en forte croissance qui développe une plateforme avancée de data science dédiée à l’automatisation et à l’industrialisation de cas d’usage sur données structurées. Le produit s’appuie sur un modèle de fondation appliqué aux données tabulaires, conçu pour être déployable rapidement en production, avec un haut niveau d’exigence sur la performance, la robustesse et la transférabilité.

Dans un environnement de recherche appliquée, vous intervenez au cœur de la nouvelle génération de modèles. Vous travaillez en proximité avec des équipes engineering et data, ainsi qu’avec des partenaires académiques et industriels, sur des problématiques à la fois scientifiques et directement actionnables.

Missions

Concevoir et améliorer des algorithmes de représentation et d’embeddings pour données tabulaires, intégrés au cœur du produit.
Définir des protocoles d’évaluation et des métriques adaptées aux cas d’usage réels, puis optimiser performance et scalabilité.
Contribuer aux stratégies d’active learning, à la sélection d’échantillons et à la consolidation des datasets train et eval.
Concevoir et enrichir des datasets favorisant représentation et transfer learning, notamment via l’usage de données synthétiques.
Analyser les mécanismes d’apprentissage afin d’orienter les itérations de recherche et les choix techniques.
Assurer une veille scientifique active et proposer des axes de recherche pertinents.
Collaborer avec ML Engineers et Data Scientists pour livrer des modèles pré entraînés et des adaptations ciblées.

Profil recherché
Doctorat terminé en IA, machine learning ou domaine connexe
Publications dans au moins une conférence scientifique de premier plan
Expérience concrète d’entraînement de modèles à l’échelle sur cloud ou cluster privé
Très bon niveau de code, capacité à prototyper et à industrialiser
Anglais courant
Autonomie, rigueur et forte appétence pour la recherche appliquée

Compétences appréciées

Expérience d’entraînement distribué et calcul intensif
Contributions open source ou compétitions data science
Capacité à démontrer l’impact opérationnel de travaux de recherche
C ou C++ en complément de Python

Environnement technique

Transformers, embeddings, representation learning, pre training, fine tuning
PyTorch ou Jax, Sklearn
Multi GPU, distribution, optimisation mémoire, performance inference
SLURM, DeepSpeed ou équivalent
Parquet, SQL et gestion de grands volumes, datasets synthétiques
Git et bonnes pratiques de développement

About the Company

Bluethink Inc: Empowering Digital Transformation with Cutting-Edge Technologies In today's fast-paced and ever-evolving digital landscape, businesses need to constantly adapt and innovate to stay ahead of the competition. This is where Bluethink Inc comes in, as a leading provider of digital transformation, ecommerce, web development, and designing solutions. With a diverse portfolio of clients and a team of highly-skilled experts, Bluethink Inc has established a solid reputation for delivering customized and scalable soluti... Know more