Machine learning

Le machine learning — apprendre à partir de données plutôt que d'instructions.

Le machine learning regroupe les techniques par lesquelles un algorithme apprend à partir de données plutôt que d'instructions explicites. Couvre la majorité des cas d'usage prédictifs en entreprise. Trois grandes familles : supervisé, non supervisé, renforcement. À distinguer de l'IA générative et du deep learning. Notre offre commerciale d'accompagnement est sur la page Expert Machine Learning. Industrialisation via MLOps.

Définition

Qu'est-ce que le machine learning

Le machine learning (apprentissage automatique en français) est la discipline informatique dans laquelle un algorithme apprend à partir d'exemples plutôt que d'instructions explicites. À partir d'un ensemble de données d'entraînement, le modèle découvre des régularités statistiques qu'il peut ensuite appliquer à de nouvelles données pour faire des prédictions ou des classifications.

Né dans les années 1950, le machine learning a connu plusieurs vagues. La plus récente, dite « ère du deep learning », a démarré dans les années 2010 avec la disponibilité de très grands jeux de données et de la puissance de calcul GPU. C'est cette vague qui a rendu possible l'IA générative moderne.

Le machine learning ne se confond pas avec l'IA générative. La majorité des cas d'usage industriels (scoring, prévision, maintenance prédictive, détection d'anomalie, segmentation) reposent toujours sur du ML classique et continueront à le faire. Les deux approches sont complémentaires, pas concurrentes.

Familles

Trois grandes familles d'apprentissage

Apprentissage supervisé

Le modèle apprend à partir d'exemples étiquetés (entrée → sortie attendue). Famille la plus utilisée en entreprise : scoring, classification, prévision. Algorithmes : régression, arbres de décision, Random Forest, XGBoost, réseaux neuronaux.

Apprentissage non supervisé

Le modèle découvre des structures dans des données sans étiquette. Cas d'usage : segmentation client, détection d'anomalie, réduction de dimensionnalité. Algorithmes : K-means, DBSCAN, ACP, autoencoders.

Apprentissage par renforcement

Le modèle apprend par essai-erreur dans un environnement, optimisant une récompense. Cas d'usage : robotique, jeux, optimisation de stratégies. Utilisé notamment dans le RLHF des LLM modernes (post-entraînement des modèles génératifs).

Algorithmes

Six familles d'algorithmes utilisés en entreprise

Régressions linéaires et logistiques : modèles simples, interprétables, performants sur données structurées. Encore très utilisés dans le scoring, la prévision, l'actuariat.
Arbres de décision et ensembles (Random Forest, XGBoost, LightGBM) : algorithmes dominants sur les données tabulaires. Performance et interprétabilité raisonnables.
Réseaux neuronaux profonds : pour les données non structurées (image, texte, audio). Voir Deep Learning.
Modèles de séries temporelles : ARIMA, Prophet, LSTM, transformers temporels. Pour la prévision de demande, de trésorerie, de consommation.
Modèles d'optimisation : programmation linéaire, optimisation combinatoire. Souvent hybridés avec du ML pour résoudre des problèmes complexes (routing, planning).
Modèles graphiques : graphes de connaissance, réseaux bayésiens. Pour les problèmes à structure relationnelle forte (recommandation, fraude).

Cas d'usage

Cas d'usage prédictifs typiques en entreprise

Scoring : crédit, risque client, fraude, qualité de leads.
Prévision : demande, ventes, trésorerie, consommation énergétique.
Classification : qualification automatique de documents, courriels, demandes.
Détection d'anomalies : transactions suspectes, défaillances industrielles, écarts comptables.
Segmentation : clientèle, comportements, équipements.
Recommandation : produits, contenus, parcours.
Maintenance prédictive : voir Maintenance prédictive IA.

Qualité

Indicateurs de qualité d'un modèle ML

La qualité d'un modèle se mesure différemment selon le type de problème :

Classification : précision, rappel, F1-score, AUC-ROC, matrice de confusion.
Régression : RMSE, MAE, R², MAPE.
Séries temporelles : MAPE, sMAPE, RMSE, métriques métier (taux d'erreur de prévision, biais).
Modèles à enjeu d'équité : indicateurs de biais (parité démographique, égalité des chances), calibration par groupe.

Au-delà des métriques techniques, la qualité opérationnelle se mesure par la valeur métier produite, mesurée en production sur des cas réels. Voir MLOps pour le suivi continu.

Parlons de votre projet

Un appel stratégique pour cadrer votre démarche IA.

Échangez avec un dirigeant Expert IA pour structurer votre projet d'intelligence artificielle — diagnostic du contexte, identification des cas d'usage prioritaires, cadrage de la démarche.

Demander un appel stratégique