L’introduzione dell’intelligenza artificiale (AI) nelle aziende di grandi dimensioni, come Microsoft e Uber, sta rivelando una realtà cruciale: il crescente consumo di risorse computazionali, misurata in token, sta diventando una minaccia per il bilancio aziendale. I dati rilevanti mostrano che il costo effettivo delle tecnologie AI si traduce non solo in infrastruttura, ma anche in una gestione quotidiana complessa di modelli di linguaggio, inferenza e tokenization.

Come funziona il sistema dei token

I token sono l’unità di base per misurare l’input e l’output nei modelli linguistici generativi, come quelli sviluppati da OpenAI o Google. Un singolo token può rappresentare una parola, una parte di una parola o un simbolo. Ad esempio, un semplice messaggio di 100 parole può tradursi in centinaia o migliaia di token, a seconda della complessità testuale. Maggiore è il numero di token processati, maggiore sarà il costo computazionale.

I prezzi di utilizzo sono chiaramente definiti dai provider: ad esempio, utilizzare i modelli GPT di OpenAI costa centesimi di euro o anche euro per ogni migliaia di token. Nelle aziende con milioni di utenti o centinaia di migliaia di chiamate al modello AI, i costi possono salire esponenzialmente, specialmente quando i prodotti vengono utilizzati per automazioni, chatbot o servizi intelligenti per clienti e agenti.

La governance dei costi diventa strategica

Microsoft, che ha investito ingenti risorse nello sviluppo dell’AI generativa (Azure OpenAI, Qwen, etc.), ha iniziato a mettere a punto strumenti avanzati di governance, monitoraggio e controllo. Queste tecnologie, come Azure AI Studio, permettono alle aziende di tracciare in tempo reale il consumo di token e di impostare limiti di spesa. Il CIO o il CFO deve oggi decidere dove collocare priorità: sperimentare nuovi modelli o ottimizzare il budget esistente.

Uber, da parte sua, sta rivedendo i propri processi operativi per ridurre il carico di inferenza. In un rapporto interno non pubblicato, l’azienda ha rivelato che l’integrazione dell’AI in alcuni contesti di servizio clienti ha causato un aumento del 20% del costo operativo mensile. Questo ha spinto le squadre tecnologiche a cercare modelli più efficienti, a migliorare le pipeline di ottimizzazione e a ridurre i token richiesti per ogni query.

Strategie per gestire al meglio i costi

Persone coinvolte e nuovi ruoli

Man mano che i costi diventano una preoccupazione prioritaria per le organizzazioni, ruoli come il Chief AI Officer o il Chief Data Officer emergono come necessari. Questi professionisti non solo seguono l’implementazione tecnologica, ma devono inoltre gestire relazioni con provider esterni, assicurando una governance economica e tecnologica solida.

Al tempo stesso, i team di sviluppo devono essere sensibilizzati sui costi di elaborazione: un CTO può introdurre linee guida tecniche riguardo all’uso responsabile dell’AI. Una politica di governance che unifica tecnologia e finanza potrebbe diventare un punto centrale del futuro dell’AI nelle aziende.