Latency
Définition
Le temps qu'il faut à une IA pour répondre après que tu postes ta question. C'est le délai entre ton input et le premier token de réponse. Plus c'est bas, plus c'est fluide pour toi.
📌 Exemple concret
ChatGPT a une latency de ~2 secondes avant de commencer à écrire, tandis qu'une IA locale sur ton ordinateur peut être instantanée.
💡 Pourquoi ça compte
La latency détermine si tu peux vraiment discuter en live avec l'IA ou si tu attendras frustré. C'est ce qui fait la différence entre génial et chiant.