cover image
ALTEN

Scientifique de données / Data Scientist

Hybrid

Montreal, Canada

Full Time

01-10-2025

Share this job:

Skills

Python SQL Regression power bi Data Science

Job Specifications

*english below*

Qui sommes-nous ?

ALTEN Canada accompagne depuis plus de 20 ans les grands acteurs du marché dans leur stratégie d’innovation et de transformation technologique. En tant que société de conseil en ingénierie et en IT, nous valorisons l’expertise de nos collaborateur·rice·s et favorisons un environnement inclusif, stimulant et collaboratif.

Quels profils recrutons-nous et pour qui ?

Nous recherchons un·e Développeur·euse IA-ML pour concevoir et mettre en œuvre un système de classification automatisée de documents techniques, basé sur leur contenu textuel et visuel. Ce poste vise à améliorer la gestion et l’accessibilité des données d’ingénierie historiques. Vous intégrerez une équipe multidisciplinaire et participerez à toutes les étapes du développement de la solution.

Quelles seront mes responsabilités ?

Analyser les besoins du projet et proposer l’approche technique optimale (ML, LLM, solutions cloud).
Concevoir et développer un pipeline de traitement de données pour extraire le texte, les métadonnées et les dessins à partir de fichiers PDF.
Développer, entraîner et valider des modèles de classification multimodaux.
Construire l’outil de classification de bout en bout, de l’entrée des données à la sortie catégorisée.
Rédiger la documentation technique et les instructions d’utilisation.

Je suis convaincu-e ! Quelles compétences dois-je avoir pour rejoindre vos équipes ?

Compétences requises :

Minimum 3 ans d’expérience professionnelle dans un rôle similaire.
Expérience démontrée en développement de modèles d’apprentissage automatique, notamment multimodaux (texte + image).
Maîtrise de Python et des bibliothèques de science des données (Pandas, NumPy, Scikit-learn).
Expérience avec des données documentaires non structurées (PDF, exports CAD, OCR, extraction basée sur la mise en page).
Connaissances en vision par ordinateur (Computer Vision).
Maîtrise des techniques d’embedding.
Bonne compréhension des algorithmes d’apprentissage supervisé et non supervisé.
Familiarité avec les architectures de deep learning (Transformers, CNNs).

Compétences souhaitées :

Expérience avec les services IA cloud (Azure, AWS, Google Vertex AI).
Connaissance de l’optimisation GPU et du suivi des coûts cloud.
Expérience avec les LLM et l’ingénierie de prompt.
Connaissance des bases de données vectorielles et de l’architecture RAG.

Pourquoi se joindre à nos équipes ?

Rejoindre ALTEN Canada, c’est intégrer une entreprise qui valorise l’innovation, la diversité et le développement professionnel. Vous aurez l’opportunité de travailler sur des projets à forte valeur ajoutée, dans un environnement bienveillant et stimulant, où vos idées et votre expertise seront reconnues.

Veuillez noter que toutes les demandes seront évaluées, toutefois, nous ne communiquerons qu’avec les candidat.e.s sélectionné.e.s dans le cadre de cette offre d’emploi.

ALTEN Canada s'engage à promouvoir l'équité, la diversité et l'inclusion. Nous nous engageons à offrir un environnement de travail où chaque personne se sente accueillie, valorisée et respectée afin de pouvoir s’épanouir pleinement.

Nous avons à cœur d’offrir des mesures d’accessibilité aux personnes qui en font la demande, à ce titre, nous vous encourageons à communiquer avec nous si vous avez besoin d’accommodation dans le cadre du processus de recrutement.

Who are we?

ALTEN Canada has been supporting major industry players for over 20 years in their innovation and technological transformation strategies. As a consulting firm in engineering and IT, we value the expertise of our team members and foster an inclusive, stimulating, and collaborative environment.

Who are we hiring and for what role?

We are looking for an AI/ML Developer to design and implement an automated classification system for technical documents based on their textual and visual content. The goal is to improve the management and accessibility of historical engineering data. You will join a multidisciplinary team and contribute to all stages of solution development.

What will my responsibilities be?

Analyze project requirements and propose the optimal technical approach (ML, LLM, cloud solutions).
Design and implement a data processing pipeline to extract text, metadata, and drawings from PDF files.
Develop, train, and validate multimodal classification models.
Build the end-to-end classification tool, from data input to categorized output.
Write technical documentation and usage instructions.

I’m convinced! What skills do I need to join your team?

Required Skills:

Minimum 3 years of professional experience in a similar role.
Proven experience in developing machine learning models, especially multimodal ones (text + image).
Proficiency in Python and core data science libraries (Pandas, NumPy, Scikit-learn).
Experience working with unstructured document data (PDFs, CAD exports, OCR, layout-based extraction).
Knowledge of Computer Vision fundamentals.
Experience with embedding techniques.
Solid u

About the Company

ALTEN Group supports the development strategy of its customers in the fields of innovation, R&D and technological information systems. Created 30 years ago, the Group has become a world leader in Engineering and Technology consulting. 24 700 highly qualified engineers carry out studies and conception projects for the Technical and Information Systems Divisions of major customers in the industrial, telecommunications and Service sectors. Our business lines: * ENGINEERING R&D and Manufacturing outsourcing : > Consulting > ... Know more