Token AI: Il conto arriva, e le aziende non …

Uber ha bruciato l’intero budget AI per il 2026 nei primi quattro mesi dell’anno. Il CTO Praveen Neppalli Naga lo ha detto senza giri di parole ad aprile: i token consumati dagli strumenti di coding agentici hanno travolto ogni previsione. Ora l’azienda ha fissato un tetto di 1.500 dollari mensili per dipendente per ciascun tool e ha introdotto una dashboard interna per monitorare i consumi in tempo reale.

Un problema non solo di Uber

Il problema non è solo di Uber. Secondo un’indagine inedita di KPMG, solo il 26% delle aziende riesce a capire davvero quanto spende in AI, mentre il 50% ha una visibilità molto limitata e il 22% scopre i costi solo quando arriva la fattura. I numeri sono coerenti con quanto emerge da altri osservatori: un sondaggio del 2025 ha rilevato che l’85% delle imprese manca le previsioni di spesa AI di oltre il 10%, e quasi un quarto le sottostima del 50% o più.

Nel frattempo, prima dell’introduzione dei cap, i singoli ingegneri di Uber generavano bollette mensili tra i 500 e i 2.000 dollari in soli consumi di token. Il CTO stesso ha bruciato 1.200 dollari in token durante una demo interna di due ore.

Il modello addebito a consumo

Il meccanismo che ha colto di sorpresa i CFO è strutturale. Il modello di addebito a consumo — ogni parola inviata al modello e ogni risposta ricevuta viene conteggiata in token e fatturata — sostituisce progressivamente le licenze flat su base utente. Il passaggio cambia tutto: con il licensing tradizionale i costi scalano con il numero di dipendenti, con i token scalano con l’intensità d’uso.

L’impatto del codice autonomo

L’AI agentica, che esegue compiti in più step in modo autonomo, moltiplica il consumo in modo geometrico. Ogni ricerca, ogni bozza di documento, ogni ciclo di feedback genera token, spesso senza che nessuno lo stia guardando. Un’azienda sanitaria ha accumulato oltre 6 milioni di dollari in costi non pianificati consumando mille miliardi di token in sei mesi, prima che il finance team capisse da dove venissero.

I costi a confronto tra modelli

Il salto di modello aggrava ulteriormente il quadro. Quando un team decide di passare da un modello leggero a uno di frontiera per ragioni di qualità — spesso senza coinvolgere chi gestisce i budget — il costo per token può moltiplicarsi da 10 a 100 volte. Ad esempio, GPT-4o costa circa 15 dollari per milione di token in output; GPT-4o-mini si ferma a 0,60 dollari. Lo stesso output generato dal modello premium costa 25 volte di più. Le fluttuazioni mensili di spesa del 40% o oltre sono considerate normali anche con organico stabile.

Evoluzione del mercato AI

In questo contesto, i budget aziendali fissati a fine 2025 — prima che gli agenti di coding diventassero strumenti di uso quotidiano — erano destinati a saltare. Le aziende rispondono con governance. Uber è la più citata, ma non è la sola. Microsoft ha cancellato le licenze interne di Anthropic dopo che i costi a token sono esplosi, e il capo dell’AI Mustafa Suleyman ha dichiarato pubblicamente che Anthropic è “estremamente costosa”. Gartner prevede che oltre il 40% dei progetti di AI agentica verrà cancellato entro il 2027, in larga parte per i costi e per l’assenza di un ritorno misurabile.

Strumenti di controllo in aumento

I nuovi strumenti adottati sono: l’uso di modelli più piccoli per compiti semplici, i tetti di spesa per team, le dashboard di monitoraggio in tempo reale e i flussi di approvazione per superare i limiti.

Modelli ridotti: per compiti banali.

Tetti di spesa: per team e singoli utenti.

Dashboard interne: per un monitoraggio costante.

Flussi di approvazione: prima di superare i limiti stabiliti.

La visione di lungo termine

La direzione di lungo periodo, però, va in senso opposto ai tagli. I prezzi per milione di token sono scesi di circa l’80% tra inizio 2025 e inizio 2026. Il consumo di token enterprise è cresciuto di 13 volte nello stesso periodo. Sam Altman ha già delineato la visione: “l’intelligenza come utility, come l’elettricità o l’acqua, comprata a consumo.”

La scommessa futura

In questo scenario, il vero campo di battaglia non sarà più quanto costa un token, ma chi riesce a misurare — con precisione — quanto vale ciascuno. Le aziende che capiranno come controllare e ottimizzare l’uso dell’AI in modo proattivo saranno quelle che andranno avanti. Le altre dovranno adattarsi in fretta o rischiare di essere sorpassate.”

Token AI: Il conto arriva, e le aziende non erano pronte