📖 Glossaire IA
Comprendre l'IA sans le jargon
84 termes essentiels expliqués comme à un ami : définition courte, exemple concret, et pourquoi ça compte. Aucun acronyme balancé sans contexte.
84 termes
Modèles & architectures
LLM
Un LLM (Large Language Model) est un programme IA entraîné sur des milliards de mots pour prédire et générer du texte. Il comprend les patte…
Transformer
Architecture de réseau de neurones fondée sur le mécanisme d'attention, qui permet au modèle de comprendre les relations entre tous les mots…
GPT
GPT signifie Generative Pre-trained Transformer. C'est une famille de modèles de langage créés par OpenAI qui peuvent générer du texte cohér…
Claude
Claude est un assistant IA conversationnel créé par Anthropic. C'est un modèle de fondation capable de comprendre et générer du texte, d'ana…
Gemini
Gemini est la famille de modèles d'IA généraliste créée par Google. Elle regroupe plusieurs versions (Nano, Pro, Ultra) capables de traiter …
Mistral
Mistral est une entreprise française créant des modèles de langage open weights performants. Ses modèles (Mistral 7B, Mixtral) rivalisent av…
Llama
Llama est une famille de modèles de langage open weights créée par Meta. Ces modèles sont librement accessibles et modifiables, contrairemen…
Modèle multimodal
Un modèle IA capable de traiter et générer plusieurs types de données simultanément : texte, images, audio, vidéo. Il comprend les relations…
Modèle de fondation
Un modèle de fondation est un grand réseau de neurones entraîné sur d'énormes quantités de données générales, capable d'effectuer de nombreu…
Frontier model
Un frontier model est le modèle IA le plus avancé disponible à un moment donné, repoussant les limites de ce qui est possible. C'est la géné…
Modèle open weights
Un modèle open weights est une IA dont les paramètres entraînés sont publiquement accessibles. Tu peux télécharger le modèle complet et l'ut…
MoE (Mixture of Experts)
Architecture où un modèle utilise plusieurs petits réseaux spécialisés (experts) au lieu d'un seul gros. Un routeur décide quel expert trait…
Entraînement
Pre-training
Phase initiale où on entraîne un modèle IA sur d'énormes quantités de données brutes (texte, images) sans objectif spécifique. Le modèle app…
Fine-tuning
Le fine-tuning consiste à réentraîner un modèle d'IA déjà entraîné sur de nouvelles données spécialisées pour l'adapter à une tâche précise.…
RLHF
Technique d'entraînement qui utilise le feedback humain pour affiner un modèle IA. Au lieu de simplement prédire le prochain mot, le modèle …
DPO
DPO (Direct Preference Optimization) est une technique d'entraînement qui aligne les modèles IA sur les préférences humaines sans utiliser d…
Distillation
Technique d'entraînement où tu comprimes un grand modèle d'IA (maître) en un plus petit (élève) qui reproduit son comportement. Le petit mod…
Quantization
La quantization réduit la précision des nombres qui représentent les poids d'un modèle IA, passant par exemple de 32 bits à 8 bits. Cela dim…
Embedding
Un embedding est une traduction mathématique d'une information (mot, image, concept) en une liste de nombres. Cette représentation numérique…
Prompting
Prompt
Instructions textuelles que tu donnes à une IA pour qu'elle comprenne ce que tu veux. C'est ta question, ta demande ou tes directives formul…
Prompt engineering
L'art de formuler des instructions précises et efficaces pour obtenir les meilleures réponses d'une IA. C'est ajuster comment tu poses ta qu…
System prompt
Instructions système cachées données à un LLM avant chaque conversation. C'est la "personnalité de base" du modèle qui définit son rôle, son…
In-context learning
L'in-context learning permet à une IA de comprendre et d'exécuter une tâche en te montrant simplement des exemples dans ta requête, sans ent…
Few-shot / Zero-shot
Zero-shot : tu demandes à l'IA de faire une tâche sans exemple. Few-shot : tu lui donnes quelques exemples avant de poser ta question. Les d…
Chain of Thought (CoT)
Technique de prompting qui demande à l'IA de montrer son raisonnement étape par étape avant de donner la réponse finale. Au lieu de répondre…
Temperature
La température contrôle le degré de créativité d'une IA lors de sa réponse. Une température basse (0,1) rend l'IA prévisible et factuelle, t…
Top-p / Top-k
Top-k et top-p sont deux techniques pour contrôler la créativité d'un LLM. Top-k limite les choix aux k mots les plus probables. Top-p sélec…
Contexte & mémoire
Token
Un token est la plus petite unité de texte qu'une IA peut traiter. C'est un mot, une partie de mot ou un caractère spécial. Les modèles comp…
Context window
La context window est la quantité de texte que l'IA peut "voir" et utiliser en même temps pour répondre. C'est comme la mémoire active du mo…
RAG (Retrieval Augmented Generation)
Technique qui augmente les capacités d'un LLM en lui fournissant des documents ou données externes récupérés en temps réel, plutôt que de se…
Vector database
Une base de données spécialisée qui stocke et retrouve des informations sous forme de vecteurs numériques. Elle transforme du texte, des ima…
Memory (mémoire IA)
Capacité d'une IA à conserver et réutiliser des informations d'une conversation à l'autre. Elle permet au modèle de se souvenir du contexte …
Agents
Agent IA
Un programme IA capable d'agir autonomement pour atteindre un objectif. Il perçoit son environnement, prend des décisions, utilise des outil…
IA agentique
L'IA agentique est une IA capable de prendre des décisions autonomes et d'agir sans intervention humaine à chaque étape. Elle peut planifier…
Tool use / Function calling
Capacité d'une IA à appeler des fonctions ou des outils externes pour accomplir une tâche. L'IA identifie qu'elle a besoin d'une action (con…
MCP (Model Context Protocol)
Le MCP est un protocole standardisé qui permet aux IA d'accéder à des outils externes et des données de manière sécurisée et structurée. Il …
Computer use
Capacité d'une IA à contrôler directement un ordinateur : cliquer, taper, naviguer dans des applications comme le ferait un humain. L'IA voi…
Multi-agent
Un système où plusieurs agents IA travaillent ensemble pour résoudre un problème complexe. Chaque agent a des rôles et capacités spécifiques…
Évaluation & limites
Hallucination
Une hallucination est quand une IA génère des informations fausses, inventées ou inexactes en les présentant comme vraies. L'IA ne « ment » …
Benchmark
Un benchmark est un test standardisé qui mesure les performances d'un modèle IA sur des tâches spécifiques. Il permet de comparer objectivem…
MMLU
Benchmark d'évaluation qui teste les connaissances générales d'une IA sur 57 disciplines différentes (maths, histoire, biologie, droit, etc.…
HumanEval
HumanEval est un benchmark qui évalue la capacité des IA à écrire du code en testant si elles résolvent correctement 164 problèmes de progra…
Alignment
L'alignment est le processus d'entraînement d'une IA pour qu'elle se comporte conformément aux valeurs et intentions humaines. C'est s'assur…
Jailbreak
Technique qui contourne les garde-fous d'une IA pour lui faire générer du contenu qu'elle est censée refuser. C'est exploiter une faille log…
Prompt injection
Technique où un utilisateur injecte des instructions malveillantes dans un prompt pour contourner les garde-fous d'une IA. L'IA exécute alor…
Red teaming
Technique de test qui consiste à chercher intentionnellement les faiblesses et les erreurs d'une IA pour évaluer sa robustesse et sa sécurit…
Steelman
Technique qui consiste à présenter la version la plus forte d'un argument, même celui qu'on désapprouve, pour l'évaluer honnêtement. C'est l…
Génératif image/vidéo
Diffusion model
Un diffusion model génère des images en partant du bruit pur et en l'affinant progressivement selon tes instructions textuelles. Il apprend …
Stable Diffusion
Modèle d'IA qui génère des images à partir de descriptions textuelles. Il fonctionne en affinant progressivement une image bruitée selon tes…
Midjourney
Midjourney est un outil d'IA génératif qui crée des images à partir de descriptions textuelles. Tu écris ce que tu veux voir, l'IA génère pl…
DALL-E
DALL-E est un modèle IA génératif créé par OpenAI capable de créer des images à partir de descriptions textuelles. Tu lui décris ce que tu v…
ControlNet
ControlNet est un module que tu ajoutes à un modèle de génération d'images pour lui imposer une structure visuelle précise. Au lieu de laiss…
LoRA
Technique d'entraînement léger qui adapte un modèle d'IA existant en ajoutant de petites couches spécialisées, sans modifier le modèle origi…
Sora
Sora est un modèle d'IA capable de générer des vidéos réalistes à partir de descriptions textuelles. Il crée des séquences vidéo complètes e…
Audio & voix
Whisper
Modèle d'IA d'OpenAI qui transcrit la parole en texte. Il comprend plusieurs langues et convertit automatiquement ce que tu dis en écrit, av…
TTS (Text-to-Speech)
Technologie qui convertit du texte écrit en parole audio naturelle. Un modèle d'IA analyse le texte et génère un fichier sonore avec une voi…
STT (Speech-to-Text)
Un système IA qui convertit la parole en texte écrit. Il écoute ce que tu dis et le transforme en mots tapés, sans avoir besoin de clavier o…
Voice cloning
Le voice cloning est une technique d'IA qui reproduit la voix d'une personne en analysant ses caractéristiques vocales (ton, accent, timbre)…
Infrastructure
GPU
Processeur graphique spécialisé qui effectue des milliers de calculs simples en parallèle. Les GPUs accélèrent massivement l'entraînement et…
TPU
Processeur spécialisé conçu par Google pour accélérer l'entraînement et l'inférence des modèles IA. Contrairement aux GPUs généralistes, les…
Inference
L'inference, c'est le moment où un modèle IA génère une réponse à partir d'une entrée. Contrairement à l'entraînement qui construit le modèl…
Latency
Le temps qu'il faut à une IA pour répondre après que tu postes ta question. C'est le délai entre ton input et le premier token de réponse. P…
Edge AI / On-device
Exécuter un modèle IA directement sur ton appareil (téléphone, montre, ordinateur) sans l'envoyer à un serveur distant. Les calculs se font …
Federated learning
L'apprentissage fédéré entraîne une IA en gardant les données chez chaque utilisateur. Au lieu de centraliser les données, on entraîne le mo…
Acronymes
AI / IA
L'intelligence artificielle est la capacité d'une machine à accomplir des tâches qui demandent normalement de l'intelligence humaine. Elle r…
ML (Machine Learning)
Le Machine Learning est une branche de l'IA où les ordinateurs apprennent à partir de données sans être explicitement programmés pour chaque…
DL (Deep Learning)
L'apprentissage profond est une branche du machine learning qui utilise des réseaux de neurones artificiels avec plusieurs couches pour appr…
NLP
Le traitement du langage naturel (NLP) est la branche de l'IA qui permet aux machines de comprendre, analyser et générer du texte ou de la p…
CNN
CNN (Convolutional Neural Network) est un type de réseau de neurones spécialisé pour analyser les images. Il utilise des filtres qui glissen…
RNN
Un Réseau de Neurones Récurrent (RNN) est un type de réseau de neurones conçu pour traiter des séquences de données. Contrairement aux résea…
AGI
L'AGI (Artificial General Intelligence) est une IA hypothétique capable de comprendre, apprendre et exécuter n'importe quelle tâche intellec…
ASI
L'ASI (Intelligence Artificielle Surhumaine) est une IA hypothétique qui dépasserait largement les capacités humaines dans tous les domaines…
Business & écosystème
Foundation model
Un modèle d'IA généraliste entraîné sur d'énormes quantités de données brutes, capable d'accomplir de nombreuses tâches différentes. Il sert…
Copilot
Un assistant IA intégré directement dans tes outils de travail (email, documents, code) qui t'aide en temps réel. Il comprend le contexte de…
API
Une API est un intermédiaire technique qui permet à deux logiciels de communiquer entre eux. Elle définit les règles pour demander des donné…
Open source
Un logiciel ou modèle IA dont le code source est publiquement accessible et modifiable par n'importe qui. Tu peux l'étudier, l'améliorer, le…
Open weights vs Open source
Open weights signifie que les paramètres entraînés d'un modèle IA sont publiquement accessibles, mais pas nécessairement le code ou les donn…
Self-hosted
Héberger et exécuter un modèle IA directement sur ses propres serveurs ou ordinateurs, plutôt que d'utiliser un service cloud distant. Tu ga…
Pricing par token
Modèle tarifaire où tu paies en fonction du nombre de tokens consommés. Chaque mot ou symbole traité par une IA coûte une fraction de centim…
Concepts généraux
Attention mechanism
Le mécanisme d'attention permet à une IA de se concentrer sur les parties pertinentes d'une entrée, comme un projecteur braquant une lumière…
Reasoning model
Un modèle d'IA capable de résoudre des problèmes complexes en montrant son raisonnement étape par étape, plutôt que de donner une réponse di…
Pretraining vs Inference
Le pretraining est la phase d'apprentissage massif où un modèle apprend les patterns du langage sur des milliards de mots. L'inference est l…
Scaling laws
Les scaling laws décrivent comment les performances d'une IA s'améliorent quand on augmente sa taille (paramètres), les données d'entraîneme…
Emergent capabilities
Des capacités que l'IA acquiert soudainement en franchissant une certaine taille ou complexité, sans que les créateurs les aient expliciteme…