📖 Glossaire IA

Comprendre l'IA sans le jargon

84 termes essentiels expliqués comme à un ami : définition courte, exemple concret, et pourquoi ça compte. Aucun acronyme balancé sans contexte.

84 termes

Modèles & architectures

LLM

Un LLM (Large Language Model) est un programme IA entraîné sur des milliards de mots pour prédire et générer du texte. Il comprend les patte…

Transformer

Architecture de réseau de neurones fondée sur le mécanisme d'attention, qui permet au modèle de comprendre les relations entre tous les mots…

GPT

GPT signifie Generative Pre-trained Transformer. C'est une famille de modèles de langage créés par OpenAI qui peuvent générer du texte cohér…

Claude

Claude est un assistant IA conversationnel créé par Anthropic. C'est un modèle de fondation capable de comprendre et générer du texte, d'ana…

Gemini

Gemini est la famille de modèles d'IA généraliste créée par Google. Elle regroupe plusieurs versions (Nano, Pro, Ultra) capables de traiter …

Mistral

Mistral est une entreprise française créant des modèles de langage open weights performants. Ses modèles (Mistral 7B, Mixtral) rivalisent av…

Llama

Llama est une famille de modèles de langage open weights créée par Meta. Ces modèles sont librement accessibles et modifiables, contrairemen…

Modèle multimodal

Un modèle IA capable de traiter et générer plusieurs types de données simultanément : texte, images, audio, vidéo. Il comprend les relations…

Modèle de fondation

Un modèle de fondation est un grand réseau de neurones entraîné sur d'énormes quantités de données générales, capable d'effectuer de nombreu…

Frontier model

Un frontier model est le modèle IA le plus avancé disponible à un moment donné, repoussant les limites de ce qui est possible. C'est la géné…

Modèle open weights

Un modèle open weights est une IA dont les paramètres entraînés sont publiquement accessibles. Tu peux télécharger le modèle complet et l'ut…

MoE (Mixture of Experts)

Architecture où un modèle utilise plusieurs petits réseaux spécialisés (experts) au lieu d'un seul gros. Un routeur décide quel expert trait…

Entraînement

Pre-training

Phase initiale où on entraîne un modèle IA sur d'énormes quantités de données brutes (texte, images) sans objectif spécifique. Le modèle app…

Fine-tuning

Le fine-tuning consiste à réentraîner un modèle d'IA déjà entraîné sur de nouvelles données spécialisées pour l'adapter à une tâche précise.…

RLHF

Technique d'entraînement qui utilise le feedback humain pour affiner un modèle IA. Au lieu de simplement prédire le prochain mot, le modèle …

DPO

DPO (Direct Preference Optimization) est une technique d'entraînement qui aligne les modèles IA sur les préférences humaines sans utiliser d…

Distillation

Technique d'entraînement où tu comprimes un grand modèle d'IA (maître) en un plus petit (élève) qui reproduit son comportement. Le petit mod…

Quantization

La quantization réduit la précision des nombres qui représentent les poids d'un modèle IA, passant par exemple de 32 bits à 8 bits. Cela dim…

Embedding

Un embedding est une traduction mathématique d'une information (mot, image, concept) en une liste de nombres. Cette représentation numérique…

Prompting

Prompt

Instructions textuelles que tu donnes à une IA pour qu'elle comprenne ce que tu veux. C'est ta question, ta demande ou tes directives formul…

Prompt engineering

L'art de formuler des instructions précises et efficaces pour obtenir les meilleures réponses d'une IA. C'est ajuster comment tu poses ta qu…

System prompt

Instructions système cachées données à un LLM avant chaque conversation. C'est la "personnalité de base" du modèle qui définit son rôle, son…

In-context learning

L'in-context learning permet à une IA de comprendre et d'exécuter une tâche en te montrant simplement des exemples dans ta requête, sans ent…

Few-shot / Zero-shot

Zero-shot : tu demandes à l'IA de faire une tâche sans exemple. Few-shot : tu lui donnes quelques exemples avant de poser ta question. Les d…

Chain of Thought (CoT)

Technique de prompting qui demande à l'IA de montrer son raisonnement étape par étape avant de donner la réponse finale. Au lieu de répondre…

Temperature

La température contrôle le degré de créativité d'une IA lors de sa réponse. Une température basse (0,1) rend l'IA prévisible et factuelle, t…

Top-p / Top-k

Top-k et top-p sont deux techniques pour contrôler la créativité d'un LLM. Top-k limite les choix aux k mots les plus probables. Top-p sélec…

Contexte & mémoire

Token

Un token est la plus petite unité de texte qu'une IA peut traiter. C'est un mot, une partie de mot ou un caractère spécial. Les modèles comp…

Context window

La context window est la quantité de texte que l'IA peut "voir" et utiliser en même temps pour répondre. C'est comme la mémoire active du mo…

RAG (Retrieval Augmented Generation)

Technique qui augmente les capacités d'un LLM en lui fournissant des documents ou données externes récupérés en temps réel, plutôt que de se…

Vector database

Une base de données spécialisée qui stocke et retrouve des informations sous forme de vecteurs numériques. Elle transforme du texte, des ima…

Memory (mémoire IA)

Capacité d'une IA à conserver et réutiliser des informations d'une conversation à l'autre. Elle permet au modèle de se souvenir du contexte …

Agents

Agent IA

Un programme IA capable d'agir autonomement pour atteindre un objectif. Il perçoit son environnement, prend des décisions, utilise des outil…

IA agentique

L'IA agentique est une IA capable de prendre des décisions autonomes et d'agir sans intervention humaine à chaque étape. Elle peut planifier…

Tool use / Function calling

Capacité d'une IA à appeler des fonctions ou des outils externes pour accomplir une tâche. L'IA identifie qu'elle a besoin d'une action (con…

MCP (Model Context Protocol)

Le MCP est un protocole standardisé qui permet aux IA d'accéder à des outils externes et des données de manière sécurisée et structurée. Il …

Computer use

Capacité d'une IA à contrôler directement un ordinateur : cliquer, taper, naviguer dans des applications comme le ferait un humain. L'IA voi…

Multi-agent

Un système où plusieurs agents IA travaillent ensemble pour résoudre un problème complexe. Chaque agent a des rôles et capacités spécifiques…

Évaluation & limites

Hallucination

Une hallucination est quand une IA génère des informations fausses, inventées ou inexactes en les présentant comme vraies. L'IA ne « ment » …

Benchmark

Un benchmark est un test standardisé qui mesure les performances d'un modèle IA sur des tâches spécifiques. Il permet de comparer objectivem…

MMLU

Benchmark d'évaluation qui teste les connaissances générales d'une IA sur 57 disciplines différentes (maths, histoire, biologie, droit, etc.…

HumanEval

HumanEval est un benchmark qui évalue la capacité des IA à écrire du code en testant si elles résolvent correctement 164 problèmes de progra…

Alignment

L'alignment est le processus d'entraînement d'une IA pour qu'elle se comporte conformément aux valeurs et intentions humaines. C'est s'assur…

Jailbreak

Technique qui contourne les garde-fous d'une IA pour lui faire générer du contenu qu'elle est censée refuser. C'est exploiter une faille log…

Prompt injection

Technique où un utilisateur injecte des instructions malveillantes dans un prompt pour contourner les garde-fous d'une IA. L'IA exécute alor…

Red teaming

Technique de test qui consiste à chercher intentionnellement les faiblesses et les erreurs d'une IA pour évaluer sa robustesse et sa sécurit…

Steelman

Technique qui consiste à présenter la version la plus forte d'un argument, même celui qu'on désapprouve, pour l'évaluer honnêtement. C'est l…

Génératif image/vidéo

Diffusion model

Un diffusion model génère des images en partant du bruit pur et en l'affinant progressivement selon tes instructions textuelles. Il apprend …

Stable Diffusion

Modèle d'IA qui génère des images à partir de descriptions textuelles. Il fonctionne en affinant progressivement une image bruitée selon tes…

Midjourney

Midjourney est un outil d'IA génératif qui crée des images à partir de descriptions textuelles. Tu écris ce que tu veux voir, l'IA génère pl…

DALL-E

DALL-E est un modèle IA génératif créé par OpenAI capable de créer des images à partir de descriptions textuelles. Tu lui décris ce que tu v…

ControlNet

ControlNet est un module que tu ajoutes à un modèle de génération d'images pour lui imposer une structure visuelle précise. Au lieu de laiss…

LoRA

Technique d'entraînement léger qui adapte un modèle d'IA existant en ajoutant de petites couches spécialisées, sans modifier le modèle origi…

Sora

Sora est un modèle d'IA capable de générer des vidéos réalistes à partir de descriptions textuelles. Il crée des séquences vidéo complètes e…

Audio & voix

Whisper

Modèle d'IA d'OpenAI qui transcrit la parole en texte. Il comprend plusieurs langues et convertit automatiquement ce que tu dis en écrit, av…

TTS (Text-to-Speech)

Technologie qui convertit du texte écrit en parole audio naturelle. Un modèle d'IA analyse le texte et génère un fichier sonore avec une voi…

STT (Speech-to-Text)

Un système IA qui convertit la parole en texte écrit. Il écoute ce que tu dis et le transforme en mots tapés, sans avoir besoin de clavier o…

Voice cloning

Le voice cloning est une technique d'IA qui reproduit la voix d'une personne en analysant ses caractéristiques vocales (ton, accent, timbre)…

Infrastructure

GPU

Processeur graphique spécialisé qui effectue des milliers de calculs simples en parallèle. Les GPUs accélèrent massivement l'entraînement et…

TPU

Processeur spécialisé conçu par Google pour accélérer l'entraînement et l'inférence des modèles IA. Contrairement aux GPUs généralistes, les…

Inference

L'inference, c'est le moment où un modèle IA génère une réponse à partir d'une entrée. Contrairement à l'entraînement qui construit le modèl…

Latency

Le temps qu'il faut à une IA pour répondre après que tu postes ta question. C'est le délai entre ton input et le premier token de réponse. P…

Edge AI / On-device

Exécuter un modèle IA directement sur ton appareil (téléphone, montre, ordinateur) sans l'envoyer à un serveur distant. Les calculs se font …

Federated learning

L'apprentissage fédéré entraîne une IA en gardant les données chez chaque utilisateur. Au lieu de centraliser les données, on entraîne le mo…

Acronymes

AI / IA

L'intelligence artificielle est la capacité d'une machine à accomplir des tâches qui demandent normalement de l'intelligence humaine. Elle r…

ML (Machine Learning)

Le Machine Learning est une branche de l'IA où les ordinateurs apprennent à partir de données sans être explicitement programmés pour chaque…

DL (Deep Learning)

L'apprentissage profond est une branche du machine learning qui utilise des réseaux de neurones artificiels avec plusieurs couches pour appr…

NLP

Le traitement du langage naturel (NLP) est la branche de l'IA qui permet aux machines de comprendre, analyser et générer du texte ou de la p…

CNN

CNN (Convolutional Neural Network) est un type de réseau de neurones spécialisé pour analyser les images. Il utilise des filtres qui glissen…

RNN

Un Réseau de Neurones Récurrent (RNN) est un type de réseau de neurones conçu pour traiter des séquences de données. Contrairement aux résea…

AGI

L'AGI (Artificial General Intelligence) est une IA hypothétique capable de comprendre, apprendre et exécuter n'importe quelle tâche intellec…

ASI

L'ASI (Intelligence Artificielle Surhumaine) est une IA hypothétique qui dépasserait largement les capacités humaines dans tous les domaines…

Business & écosystème

Foundation model

Un modèle d'IA généraliste entraîné sur d'énormes quantités de données brutes, capable d'accomplir de nombreuses tâches différentes. Il sert…

Copilot

Un assistant IA intégré directement dans tes outils de travail (email, documents, code) qui t'aide en temps réel. Il comprend le contexte de…

API

Une API est un intermédiaire technique qui permet à deux logiciels de communiquer entre eux. Elle définit les règles pour demander des donné…

Open source

Un logiciel ou modèle IA dont le code source est publiquement accessible et modifiable par n'importe qui. Tu peux l'étudier, l'améliorer, le…

Open weights vs Open source

Open weights signifie que les paramètres entraînés d'un modèle IA sont publiquement accessibles, mais pas nécessairement le code ou les donn…

Self-hosted

Héberger et exécuter un modèle IA directement sur ses propres serveurs ou ordinateurs, plutôt que d'utiliser un service cloud distant. Tu ga…

Pricing par token

Modèle tarifaire où tu paies en fonction du nombre de tokens consommés. Chaque mot ou symbole traité par une IA coûte une fraction de centim…

Concepts généraux

Attention mechanism

Le mécanisme d'attention permet à une IA de se concentrer sur les parties pertinentes d'une entrée, comme un projecteur braquant une lumière…

Reasoning model

Un modèle d'IA capable de résoudre des problèmes complexes en montrant son raisonnement étape par étape, plutôt que de donner une réponse di…

Pretraining vs Inference

Le pretraining est la phase d'apprentissage massif où un modèle apprend les patterns du langage sur des milliards de mots. L'inference est l…

Scaling laws

Les scaling laws décrivent comment les performances d'une IA s'améliorent quand on augmente sa taille (paramètres), les données d'entraîneme…

Emergent capabilities

Des capacités que l'IA acquiert soudainement en franchissant une certaine taille ou complexité, sans que les créateurs les aient expliciteme…