¿De verdad se está abaratando el AI? La ilusión del coste de los tokens
Imaginemos a un director financiero revisando el gasto trimestral de cloud. El equipo de AI presenta un gráfico convincente: los costes de inferencia por token han bajado un 75% con respecto al año anterior. Los modelos son más rápidos, las API son más baratas y el proveedor ofrece descuentos por volumen. Todo apunta a un ahorro. Entonces llega la factura real, y el total es más alto que el del trimestre anterior.






