Llama IA

Llama — la famille de LLM open source de Meta.

Llama est la famille de LLM open source de Meta, l'une des principales alternatives aux modèles propriétaires comme ChatGPT ou Claude. Alternative française open source : Mistral. Pour le concept LLM, voir LLM dans le guide.

Présentation

Llama — les modèles open-source de Meta

Llama est la famille de modèles de langage open-source développée par Meta (Facebook), lancée en février 2023 avec Llama 1. Avec ses versions successives (Llama 2 en 2023, Llama 3 en 2024, Llama 4 en 2025), elle s'est imposée comme la principale référence open-source, alternative aux modèles propriétaires d'OpenAI, Anthropic et Google.

Le positionnement open-source de Llama répond à plusieurs besoins entreprise : auto-hébergement (souveraineté complète), personnalisation profonde (fine-tuning local), indépendance fournisseur (pas de verrouillage), coût d'inférence maîtrisé (selon l'infrastructure).

Versions

Famille Llama 4 et au-delà

Llama 4, lancée en 2025, propose plusieurs tailles de modèles adaptés à différents contextes :

Llama 4 Scout : modèle équilibré pour les usages standards, déployable sur infrastructure raisonnable.
Llama 4 Maverick : modèle plus puissant pour les tâches complexes.
Llama 4 Behemoth : modèle haut de gamme rivalisant avec les meilleurs propriétaires.
Variantes Code : versions spécialisées sur le code (CodeLlama).
Variantes multimodales : capacités vision intégrées progressivement.

Licence

Open-source... à conditions

Llama est distribuée sous une licence permissive mais conditionnée, plus restrictive qu'une licence ouverte classique (MIT, Apache 2.0). Les principaux points de vigilance :

Usage commercial autorisé jusqu'à un certain seuil d'utilisateurs (typiquement 700 millions d'utilisateurs mensuels actifs) — au-delà, demande d'autorisation à Meta.
Restrictions sur l'utilisation pour entraîner d'autres modèles concurrents.
Mention obligatoire de l'utilisation de Llama dans les produits dérivés.

Pour les entreprises classiques (jusqu'à plusieurs milliards d'utilisateurs annuels en cumulé), ces conditions sont rarement bloquantes. Pour les GAFAM concurrents, elles le sont structurellement.

Déploiement

Options de déploiement

Auto-hébergement

Déploiement sur votre propre infrastructure (cloud privé, serveurs internes). Maîtrise totale, souveraineté absolue. Demande des compétences techniques et de l'infrastructure GPU.

Plateformes managées

Hébergement managé de Llama chez les principaux clouds : AWS Bedrock, Google Cloud, Azure, Together AI, Groq. Démarrage rapide, configuration de résidence européenne possible.

Ollama et stack locale

Pour les usages locaux (poste développeur ou serveur d'entreprise), Ollama permet d'exécuter Llama et autres modèles open-source avec une configuration minimale.

Comparatif

Llama vs alternatives open-source

Mistral : seul vrai concurrent européen open-source. Champion souverain pour la France.
DeepSeek : modèles open-source chinois, performances élevées, vigilance souveraineté.
Qwen (Alibaba) : famille de modèles open-source compétitive, vigilance souveraineté.
Falcon, Phi (Microsoft) : autres options open-source notables.

Pour les organisations européennes ayant des exigences fortes de souveraineté, Mistral reste préférable à Llama. Llama reste pertinent pour les déploiements internationaux ou les organisations qui privilégient la flexibilité technique pure.