Les modèles sur appareil deviennent assez bons pour laisser le cloud derrière eux
Une nouvelle vague de petits modèles fonctionne entièrement sur votre ordinateur portable ou téléphone — rapide, privée et sans compteur d'API.

Pendant des années, l’hypothèse était que l’IA utile devait vivre dans le centre de données de quelqu’un d’autre. Cette hypothèse s’effondre discrètement.
La dernière génération de petits modèles — quelques milliards de paramètres, quantifiés pour fonctionner sur du matériel grand public — est désormais assez bonne pour la synthèse, la rédaction, la classification et la complétion de code sans jamais toucher un réseau.
Privé par défaut
L’exécution locale change la donne en matière de confidentialité. Rien ne quitte l’appareil, il n’y a aucun coût par requête, et le modèle continue de fonctionner dans un avion ou un sous-sol.
Le compromis réside dans la capacité : les plus grands modèles d’avant-garde gagnent toujours sur les tâches de raisonnement les plus difficiles. Mais pour la longue traîne des tâches quotidiennes, “assez bon et sur ma machine” commence à battre “excellent et facturé.”


