L'intelligenza artificiale è stata a lungo considerata il massimo propulsore di produttività, ma ora sta causando brividi in molti consigli di amministrazione. Il motivo: fatture esorbitanti e imprevedibili per servizi cloud e token. Quando aziende come Uber esauriscono i loro budget annuali per l'IA in pochi mesi, e i giganti della tecnologia scoprono che la capacità di elaborazione sta diventando più costosa del proprio personale in alcune aree, si raggiunge un punto di svolta critico. L'euforia iniziale cede il passo a una dura realtà in cui i costi nascosti degli agenti di IA autonomi e i modelli di fatturazione basati sull'uso minacciano la redditività. Ma ci sono soluzioni: per evitare di cadere nella trappola dei costi dei token, sta emergendo un nuovo concetto strategico: l'IA gestita. Scoprite perché i calcoli dei costi di molte aziende non tornano più e quali strategie specifiche di FinOps potete utilizzare per controllare le vostre spese in IA prima che il budget si esaurisca.
L'industria tecnologica sta vivendo una disillusione a lungo attesa: l'intelligenza artificiale non è più solo un motore di produttività in molte aziende, ma è diventata un fattore di costo indipendente e difficile da calcolare, che, in casi estremi, supera i costi del personale. Ciò che due anni fa sembrava una previsione audace, ora è una cruda realtà aziendale nel 2026. La domanda non è più se l'IA crea valore aggiunto, ma se questo valore aggiunto giustifica il vertiginoso aumento dei costi operativi. E all'orizzonte, emerge un concetto che promette di dare risposte: l'IA gestita.
I costi nascosti dell'IA: la trappola invisibile che sbilancia i bilanci aziendali
Per due anni, le aziende tecnologiche hanno a malapena messo in discussione i loro budget per l'IA. La logica era ingannevolmente semplice: chi investe presto ottiene un vantaggio competitivo; chi esita resta indietro. In questo clima di ottimismo, miliardi sono stati investiti in modelli linguistici, assistenti di programmazione e agenti autonomi, spesso senza una misurazione rigorosa delle prestazioni e senza limiti di costo. Ora arriva il momento di pagare le conseguenze, e le cifre sono difficili da ignorare.
Il problema diventa particolarmente evidente quando l'IA viene utilizzata non solo come strumento, ma come principale fonte di lavoro. Bryan Catanzaro, vicepresidente di apprendimento profondo applicato presso Nvidia, lo ha riassunto in una frase per Axios: i costi di calcolo del suo team superano di gran lunga i costi del personale. Questa affermazione ha un peso considerevole, non solo perché proviene da un'azienda che si trova al centro dell'ondata di infrastrutture IA, ma perché descrive un cambiamento sistemico che finora si è a malapena riflesso nei rapporti di gestione.
Fatturazione basata su token: l'elefante nella stanza
La ragione risiede nella struttura dei moderni modelli di fatturazione dell'IA. I grandi modelli linguistici come GPT, Claude o Gemini non applicano una tariffa fissa, ma si basano sui token, le unità più piccole in cui il testo viene diviso durante l'elaborazione. I modelli premium costano tra i 2,50 e i 5,00 dollari per milione di token di input e tra i 10 e i 25 dollari per milione di token di output. Questo può sembrare astratto, ma diventa rapidamente concreto: chiunque invii migliaia di query giornaliere attraverso un sistema di IA in produzione, esegua agenti con ampie finestre di contesto o effettui revisioni automatiche del codice accumula somme enormi, spesso senza rendersene conto fino all'arrivo della fattura mensile.
Il caso Uber: quando il budget di IA si esaurisce in mesi
Nessuno dei casi recenti illustra il problema con tanta chiarezza come quello di Uber. Praveen Neppalli Naga, direttore della tecnologia dell'azienda di trasporti, ha ammesso a The Information che l'azienda aveva già esaurito l'intero budget di IA per il 2026 a pochi mesi dall'inizio dell'anno, principalmente a causa della rapida adozione di Claude Code di Anthropic. Naga lo ha espresso senza mezzi termini: "Ho ricominciato da zero perché il budget che credevo necessario era già esaurito." Il detonante non è stato un unico progetto importante, ma l'espansione graduale dello strumento in tutto il dipartimento di ingegneria. Uber aveva concesso l'accesso a Claude Code a circa 5000 sviluppatori, e l'impatto sul budget è stato, di conseguenza, significativo.
Ciò che Naga ha anche rivelato è sorprendente: l'11% di tutti gli aggiornamenti in tempo reale del repository di codice di Uber è ora effettuato da agenti di IA, non da esseri umani. Pertanto, l'azienda si trova nel mezzo di un'autentica trasformazione dello sviluppo software, e sta pagando un prezzo che ha superato di gran lunga tutti i calcoli iniziali. La paradossale evidenza è chiara: più l'IA è utile, più viene utilizzata e maggiori sono i costi. Il modello di prezzi basato sull'uso traduce direttamente il successo in pressione sui costi.
Jason Calacanis, un noto investitore di Silicon Valley, ha descritto un'esperienza simile: costi per agente di 300 dollari al giorno nell'API Claude di Anthropic, per una frazione del lavoro di un singolo dipendente. Il suo verdetto: "A che punto i costi dei token superano il salario della persona che intendono sostituire?" Questa domanda – retorica, ma matematicamente reale – è diventata la questione centrale dell'economia dell'IA nel 2026.
Il fenomeno Swan AI: una fattura da sei cifre come simbolo di status
All'altro estremo dello spettro si trova Amos Bar-Joseph, CEO di Swan AI, una startup con quattro dipendenti. Ha pubblicato su LinkedIn una fattura di Anthropic di 113.421,87 dollari corrispondente a un solo mese, affermando di non essersi mai sentito così orgoglioso di una fattura. Swan AI, azienda specializzata in agenti di vendita autonomi, considera il suo investimento in IA come una sostituzione strutturale dei costi del personale: meno dipendenti, più intelligenza; questa è la promessa. Il CEO lo ha esplicitamente presentato come un modello di business: l'obiettivo è raggiungere 10 milioni di dollari di ricavi ricorrenti annuali per dipendente.
Il fatto che Swan AI riporti già ricavi ricorrenti a sette cifre e, secondo le sue stesse dichiarazioni, abbia recentemente ottenuto circa 200.000 dollari in ricavi ricorrenti annuali in una sola settimana, suona convincente. Tuttavia, ciò che Bar-Joseph non ha rivelato rimane cruciale: il margine. Se una fattura di IA di 113.000 dollari al mese equivale a costi annuali che superano 1,3 milioni di dollari, i ricavi generati devono essere significativamente maggiori, e con un margine sufficiente a coprire l'infrastruttura, le tasse e altre spese. Fonti indipendenti confermano che l'azienda si è rifiutata di fornire cifre di ricavo specifiche. Ciò che viene venduto come una storia di successo potrebbe facilmente essere una contabilità incompleta.
Tuttavia, la pubblicazione di Bar-Joseph rivela un cambiamento di mentalità: in alcuni settori dell'industria tecnologica, il costo dell'IA sta diventando un simbolo di status, proprio come il numero di dipendenti o lo spazio ufficio erano considerati un indicatore della dimensione dell'azienda. Questa logica comporta rischi significativi se le spese e i ricavi non sono strettamente collegati.
Un segnale di allarme per il mercato globale
Il mercato è in piena espansione: i 6,31 trilioni di dollari di spesa in IT servono come segnale di allerta.