Job Specifications
Informations générales
STAGE 2026 - Assistant IA Hors-Ligne - F/H
Boulogne-Billancourt, FRANCE
Label Pro Vélo - Niveau Argent : nous sommes en selle… vous venez ? (site de Labège)
CARL BERGER-LEVRAULT : 30 ANNEES DE SPECIALISATION EN GMAO ET ASSET MANAGEMENT
CARL, marque de Berger-Levrault est un éditeur de logiciel spécialisé dans la gestion de la maintenance industrielle et tertiaire, numéro 1 en France et leader européen.
L’entreprise accompagne plusieurs dizaines de milliers d’utilisateurs dans 25 pays pour adresser les enjeux de l’industrie du futur, des villes et bâtiments intelligents. Elle propose
une offre logicielle adaptée à la gestion des équipements des secteurs suivants :
Industrie : équipements industriels et moyens généraux
Bâtiments : équipements et infrastructures techniques du tertiaire
Villes : patrimoine, infrastructures, réseaux publics
Transport : matériels roulants, infrastructures fixes et linéaires
Santé : équipements techniques, biomédicaux
Engagés dans une transformation numérique responsable, les 2 200 collaborateurs du groupe Berger-Levrault agissent au quotidien pour être à la hauteur des enjeux sociétaux, économiques et environnementaux de leurs clients par la création de solutions digitales de confiance.
VOS PRINCIPALES RESPONSABILITES
Sujet : Générateur Intelligent de Packs d'Assistance pour la Maintenance Industrielle Hors-Ligne
Contexte :
Les techniciens de maintenance interviennent régulièrement dans des environnements totalement déconnectés : tunnels, sous-sols industriels, zones isolées ou sites sécurisés. Dans ces situations, notre assistant IA en ligne (basé sur un LLM déployé sur nos serveurs) devient inutilisable.
Pour dépasser cette limite, CARL développe un assistant IA hors-ligne reposant sur des tiny LLM embarqués (Phi, Gemma Nano, TinyLlama…). Ces modèles ne peuvent être réellement efficaces que s’ils disposent d’un pack d’assistance : un ensemble optimisé de documents, extraits pertinents, historiques, procédures et métadonnées de recherche adaptés à leur capacité de contexte réduite.
Ce pack doit être généré en amont, en combinant :
les données issues de la GMAO CARL Source,
la documentation technique et les historiques d’intervention,
et les capacités de notre assistant IA en ligne (via API interne) pour identifier les sections réellement utiles.
Le format de pack, le modèle d’embedding et le moteur hors-ligne existant seront fournis : le stage se concentre sur la génération et l’optimisation des contenus
Objectif :
Concevoir et prototyper un système capable de créer automatiquement un pack d’assistance compact, pertinent et exploitable par un tiny LLM hors-ligne, à partir :
de l’analyse d’un ordre de travail,
de la sélection intelligente des contenus pertinents,
de la génération des embeddings, index et métadonnées nécessaires au moteur offline.
Missions :
Sélection de contenu
Analyser l’OT (Ordre de travail) pour identifier les besoins documentaires.
Extraire les sections pertinentes (PDF, images, historiques).
Utiliser l’assistant IA en ligne pour obtenir résumés et extraits ciblés.
Fusionner et filtrer ces contenus pour ne conserver que l’essentiel.
Construction du pack hors-ligne
Générer embeddings et index locaux (modèles fournis).
Structurer le pack dans le format standard du moteur offline.
Préparer le chunking adapté aux tiny LLMs.
Optimisation
Compresser et réduire la taille.
Dédupliquer et prioriser les contenus.
Mettre en place des indicateurs simples de qualité.
Tests
Tester le pack dans l’assistant hors-ligne existant.
Vérifier pertinence, cohérence et temps de réponse.
Valider le comportement sur mobile.
Extensions possibles
Packs multi-interventions.
Mises à jour incrémentales.
Scoring qualité avancé.
Livrables
Prototype fonctionnel du générateur de packs
Pipeline d’extraction et de sélection de contenu
Spécification du pack (structure, index, métadonnées)
Rapport d’optimisation
Jeux de tests et résultats de compatibilité
Documentation d’intégration
Les plus de ce stage :
Travail direct sur embeddings, index vectoriels, chunking et pipelines documentaires
Possibilité d’accès à une thèse CIFRE / doctorat sur les tiny LLM et l’Edge AI
CETTE OFFRE EST FAITE POUR VOUS ?
Vous êtes étudiant en Informatique, Génie Logiciel ou Data Engineering et vous recherchez un stage de 6 mois débutant au printemps 2026.
Vous avez une excellente maîtrise de Python.
Vous possédez des compétences en traitement documentaire, NLP ou indexation.
Vous comprenez les contraintes mobiles (stockage, mémoire).
Vous avez des notions en RAG, embeddings et chunking.
Vous vous intéressez à l’Edge AI / IA embarquée.
Vous connaissez les environnements industriels ou la GMAO.
VOTRE FUTURE DREAM TEAM
Intégré(e) à la Direction de la Recherche et de l’Innovation Technologique (DRIT) de Berger Levrault, vous rejoindrez une équipe innovante qui valorise la curiosité, la collaboration et l’expérimentation. Chercheurs, doctorants, étudiants et ingé
About the Company
Berger-Levrault is an international software publisher headquartered in France, providing solutions and services to local authorities and administration, healthcare facilities, industries and educational institutions. The Group has offices in Europe, Morocco and Canada, and serves 40,000 customers across 5 continents.
Berger-Levrault is the leading specialist in Human Resources and Financial Management software solutions for public and semi-public sectors in France and Spain, and is also the European leader in maintenance m...
Know more