Description du poste

Dans le cadre d’un programme IA Générative stratégique à l’échelle groupe, nous recherchons un Senior AI Engineer capable d’industrialiser des solutions GenAI souveraines basées sur la plateforme Mistral AI dans un environnement bancaire critique, sécurisé et fortement réglementé.

Le contexte est particulièrement stimulant techniquement : déploiement massif de LLMs, architectures agentiques avancées, optimisation d’inférence, sécurisation des usages IA, orchestration multi-agents et industrialisation MLOps à grande échelle.

Vous rejoindrez une équipe transverse IA Gen composée d’AI Engineers, Platform Engineers, MLOps, Data Engineers, Security Engineers et Product teams afin de construire les futurs standards IA du Groupe.

Enjeux techniques du programme

Déploiement enterprise-scale de modèles Mistral
Construction de plateformes GenAI souveraines et sécurisées
Développement d’agents IA autonomes et multi-agents
Industrialisation de pipelines LLMOps / MLOps
Optimisation performance / latence / coût GPU
Gouvernance IA, sécurité et conformité AI Act
Détection d’hallucinations et contrôle qualité des outputs
Observabilité et monitoring des systèmes IA en production
Intégration des solutions IA dans le SI bancaire critique

Vos responsabilités
=======================

Engineering LLM & GenAI

Concevoir et développer des applications IA générative robustes exploitant Mistral et autres LLM open-source/propriétaires
Construire des architectures RAG avancées adaptées à des usages enterprise-scale
Implémenter des pipelines de prompting complexes :
- few-shot
- chain-of-thought
- structured prompting
- tool calling
- function calling
- context management
Optimiser les performances d’inférence, la qualité des réponses et la consommation des ressources
Évaluer les modèles selon des métriques :
- hallucination rate
- factuality
- latency
- token efficiency
- cost efficiency

Agentic AI & Multi-Agent Systems

Concevoir des agents IA autonomes capables de :
- reasoning
- planning
- memory management
- tool orchestration
- workflow execution
Développer des architectures multi-agents distribuées
Implémenter des mécanismes de coordination, supervision et fallback agents
Gérer les contextes conversationnels complexes et les interactions user-agent
Travailler avec :
- LangChain
- LangGraph
- CrewAI
- AutoGen
- Semantic Kernel
- MCP servers / tool ecosystems

AI Platform & MLOps

Industrialiser les déploiements IA dans des environnements Kubernetes sécurisés
Construire des pipelines CI/CD dédiés aux modèles et applications IA
Mettre en place :
- model versioning
- prompt versioning
- evaluation pipelines
- observability
- tracing
- monitoring LLM
Participer à l’optimisation GPU / inference serving
Collaborer étroitement avec les équipes DevOps et Platform Engineering

AI Safety / Security / Compliance

Implémenter des guardrails et mécanismes de contrôle :
- prompt injection protection
- jailbreak detection
- toxicity filtering
- PII masking
- hallucination mitigation
Garantir la conformité :
- RGPD
- AI Act
- auditabilité
- explicabilité
- sécurité des données
Participer aux stratégies de gouvernance IA du Groupe

Stack technique cible

Langages & Frameworks

Python
FastAPI
Pydantic
AsyncIO

LLM / GenAI

Mistral AI
OpenAI
Claude
Llama
Hugging Face
vLLM
Ollama
Transformers

Agentic Frameworks

LangChain
LangGraph
CrewAI
AutoGen
Semantic Kernel

RAG / Search

Vector DB
Embeddings
Hybrid Search
Reranking
Knowledge Retrieval

Infra / Cloud / MLOps

Docker
Kubernetes
Helm
CI/CD
MLflow
GitLab CI
Observability stacks

**Profil recherché

Profil recherché**

5+ années d’expérience en Software Engineering / AI Engineering
Expérience solide en GenAI et architectures LLM en production
Forte expertise Python et engineering backend
Expérience concrète sur des systèmes agentiques
Très bonne compréhension des problématiques d’industrialisation IA
Expérience en environnement critique ou réglementé fortement appréciée
Capacité à intervenir sur des sujets architecture, performance et sécurité

Très gros plus

Expérience Mistral AI
Déploiement self-hosted de LLMs
Optimisation inference serving
Fine-tuning / PEFT / LoRA
Expérience GPU workloads
Expérience plateforme IA enterprise
Banking / Finance / Cybersecurity background

Tags & focus areas

Used for matching and alerts on DevFound

Fulltime Ai Ai Engineer Mlops Data Engineer Generative Ai

Senior AI Engineer - LLM / Agentic AI / Mistral AI / Platform Engineering - CDI