Description du poste
Dans le cadre d’un programme IA Générative stratégique à l’échelle groupe, nous recherchons un Senior AI Engineer capable d’industrialiser des solutions GenAI souveraines basées sur la plateforme Mistral AI dans un environnement bancaire critique, sécurisé et fortement réglementé.
Le contexte est particulièrement stimulant techniquement : déploiement massif de LLMs, architectures agentiques avancées, optimisation d’inférence, sécurisation des usages IA, orchestration multi-agents et industrialisation MLOps à grande échelle.
Vous rejoindrez une équipe transverse IA Gen composée d’AI Engineers, Platform Engineers, MLOps, Data Engineers, Security Engineers et Product teams afin de construire les futurs standards IA du Groupe.
Enjeux techniques du programme
- Déploiement enterprise-scale de modèles Mistral
- Construction de plateformes GenAI souveraines et sécurisées
- Développement d’agents IA autonomes et multi-agents
- Industrialisation de pipelines LLMOps / MLOps
- Optimisation performance / latence / coût GPU
- Gouvernance IA, sécurité et conformité AI Act
- Détection d’hallucinations et contrôle qualité des outputs
- Observabilité et monitoring des systèmes IA en production
- Intégration des solutions IA dans le SI bancaire critique
Vos responsabilités
=======================
Engineering LLM & GenAI
- Concevoir et développer des applications IA générative robustes exploitant Mistral et autres LLM open-source/propriétaires
- Construire des architectures RAG avancées adaptées à des usages enterprise-scale
Implémenter des pipelines de prompting complexes :
- few-shot
- chain-of-thought
- structured prompting
- tool calling
- function calling
- context management
Optimiser les performances d’inférence, la qualité des réponses et la consommation des ressources
Évaluer les modèles selon des métriques :
- hallucination rate
- factuality
- latency
- token efficiency
- cost efficiency
Agentic AI & Multi-Agent Systems
Concevoir des agents IA autonomes capables de :
- reasoning
- planning
- memory management
- tool orchestration
- workflow execution
Développer des architectures multi-agents distribuées
Implémenter des mécanismes de coordination, supervision et fallback agents
Gérer les contextes conversationnels complexes et les interactions user-agent
Travailler avec :
- LangChain
- LangGraph
- CrewAI
- AutoGen
- Semantic Kernel
- MCP servers / tool ecosystems
AI Platform & MLOps
- Industrialiser les déploiements IA dans des environnements Kubernetes sécurisés
- Construire des pipelines CI/CD dédiés aux modèles et applications IA
Mettre en place :
- model versioning
- prompt versioning
- evaluation pipelines
- observability
- tracing
- monitoring LLM
Participer à l’optimisation GPU / inference serving
Collaborer étroitement avec les équipes DevOps et Platform Engineering
AI Safety / Security / Compliance
Implémenter des guardrails et mécanismes de contrôle :
- prompt injection protection
- jailbreak detection
- toxicity filtering
- PII masking
- hallucination mitigation
Garantir la conformité :
- RGPD
- AI Act
- auditabilité
- explicabilité
- sécurité des données
Participer aux stratégies de gouvernance IA du Groupe
Stack technique cible
Langages & Frameworks
- Python
- FastAPI
- Pydantic
- AsyncIO
LLM / GenAI
- Mistral AI
- OpenAI
- Claude
- Llama
- Hugging Face
- vLLM
- Ollama
- Transformers
Agentic Frameworks
- LangChain
- LangGraph
- CrewAI
- AutoGen
- Semantic Kernel
RAG / Search
- Vector DB
- Embeddings
- Hybrid Search
- Reranking
- Knowledge Retrieval
Infra / Cloud / MLOps
- Docker
- Kubernetes
- Helm
- CI/CD
- MLflow
- GitLab CI
- Observability stacks
**Profil recherché
Profil recherché**
- 5+ années d’expérience en Software Engineering / AI Engineering
- Expérience solide en GenAI et architectures LLM en production
- Forte expertise Python et engineering backend
- Expérience concrète sur des systèmes agentiques
- Très bonne compréhension des problématiques d’industrialisation IA
- Expérience en environnement critique ou réglementé fortement appréciée
- Capacité à intervenir sur des sujets architecture, performance et sécurité
Très gros plus
- Expérience Mistral AI
- Déploiement self-hosted de LLMs
- Optimisation inference serving
- Fine-tuning / PEFT / LoRA
- Expérience GPU workloads
- Expérience plateforme IA enterprise
- Banking / Finance / Cybersecurity background