SFT (Supervised Fine-Tuning)
Entraînement supervisé classique sur un dataset de paires entrée-sortie. Méthode de base, applicable à tous les modèles. Coût proportionnel à la taille du modèle.
Fine-tuning — adapter un Large Language Model à votre métier.
Le fine-tuning consiste à entraîner un LLM pré-existant sur un jeu de données spécifique pour adapter son comportement, son style, son vocabulaire ou ses connaissances spécialisées. C'est l'option d'adaptation la plus technique et la plus coûteuse, à différencier de prompt engineering (configuration par instruction) et RAG (enrichissement par documents).
Le fine-tuning est souvent surinvoqué en entreprise. La grande majorité des cas d'usage qui semblent justifier un fine-tuning se résolvent en réalité plus simplement et plus durablement avec un RAG bien conçu et un prompt engineering soigné. Le fine-tuning ne devrait être considéré qu'après échec des deux autres approches.
| Critère | Prompt engineering | RAG | Fine-tuning |
|---|---|---|---|
| Coût initial | Très faible | Modéré | Élevé |
| Mise à jour | Instantanée | Réindexation simple | Réentraînement coûteux |
| Données nécessaires | Quelques exemples | Base documentaire | Centaines à milliers d'exemples annotés |
| Verrouillage modèle | Faible | Modéré | Fort (modèle dédié) |
| Adapté pour | Format, ton, instructions | Connaissance documentaire | Style très spécifique, raisonnement spécialisé |
| Maintenabilité | Excellente | Bonne | Lourde (réentraînements répétés) |
Notre recommandation : commencer par prompt engineering, puis RAG si nécessaire, puis fine-tuning en dernier recours. C'est l'ordre de coût et de complexité croissants.
Entraînement supervisé classique sur un dataset de paires entrée-sortie. Méthode de base, applicable à tous les modèles. Coût proportionnel à la taille du modèle.
Technique d'efficacité paramétrique : on n'entraîne qu'une petite partie du modèle (matrices de rang faible). Coût significativement réduit, qualité proche du fine-tuning complet sur la plupart des cas.
Variante de LoRA avec quantization 4-bits, réduisant encore les besoins en mémoire GPU. Permet le fine-tuning de modèles importants sur du matériel grand public.
Méthode récente pour aligner un modèle sur des préférences humaines, sans avoir besoin d'un modèle de récompense séparé. Alternative simplifiée au RLHF traditionnel.
Industrialisation indispensable via MLOps. Sans MLOps, un fine-tuning devient ingérable dans la durée.
Parlons de votre projet
Échangez avec un dirigeant Expert IA pour structurer votre projet d'intelligence artificielle — diagnostic du contexte, identification des cas d'usage prioritaires, cadrage de la démarche.