Le AI est-il vraiment en train de baisser ? L'illusion du coût unitaire
Imaginez un directeur financier en train d'examiner les dépenses trimestrielles cloud. L'équipe AI lui présente un graphique convaincant : les coûts d'inférence par jeton ont baissé de 75% d'une année sur l'autre. Les modèles sont plus rapides, les API sont moins chères et le fournisseur propose des remises sur volume. Tout semble indiquer des économies. Puis la facture arrive, et le montant total est plus élevé que celui du trimestre dernier.






