Tag
#huggingface
2 articles sur ce sujet.
Intermédiaire2 min·22 mai 2026
KVBoost : accélère tes LLM de 5 à 48× sans GPU supplémentaire
Réutilise les caches d'un modèle LLM sur HuggingFace pour diviser par 5 le temps de réponse — et fais tourner du 32B sur 8 GB de RAM.
#llm#inference#optimization
Intermédiaire2 min·8 mai 2026
Entraîner une IA médicale sans NVIDIA : le pari gagnant d'AMD
Un modèle d'IA clinique affiné sur du matériel AMD en 5 minutes, sans une seule ligne de CUDA.
#amd-rocm#lora-fine-tuning#ia-medicale