Gpt 5.6: ecco dove arriva l’ultima frontiera…

OpenAI ha annunciato l’arrivo di GPT-5.6, una famiglia di modelli suddivisi in tre versioni: Sol, Terra e Luna. Ciascun modello si distingue per capacità, velocità e costo, mirando a rispondere alle esigenze diverse degli utenti.

Sol è il modello più avanzato e destinato ai compiti più complessi, come la programmazione, la ricerca scientifica e il coordinamento di strumenti. Terra propone un equilibrio tra capacità e costo mentre Luna privilegia velocità e sostenibilità economica.

Dall’accesso restrittivo a una governance globale

Il lancio di GPT-5.6 cade nel contesto di una stretta collaborazione tra OpenAI e le autorità statunitensi. L’accesso iniziale è limitato a un gruppo selezionato di organizzazioni ammesse all’anteprima, al fine di rispettare le normative del governo federale.

La data ufficiale di lancio di GPT-5.6 è il 26 giugno. Tuttavia il periodo d’anteprima è riservato a clienti selezionati. Il pubblico generale potrà usufruire della tecnologia attraverso ChatGPT e la piattaforma di sviluppatori OpenAI “nelle prossime settimane”.

I costi di utilizzo e le funzioni avanzate

I costi tra i modelli variano notevolmente. Per un milione di token, Sol costa 5 dollari in ingresso e 30 dollari in uscita. Terra costa 2,5 dollari in ingresso e 15 dollari in uscita. Luna è il più economico: 1 dollaro in ingresso e 6 dollari in uscita.

OpenAI introduce con Sol nuovi livelli di ragionamento: “Max” per un tempo esteso di elaborazione e “Ultra” per accelerare compiti articolati. Queste configurazioni sono adatte a compiti complessi e di lunga durata.

La posizione di OpenAI sull’esperimento federale

L'accesso limitato ai modelli di GPT-5.6 nasconde dietro sé una governance governativa in via di costruzione. A quanto riferiscono alcuni report, come quello dell’Associated Press, sono state approvate circa venti organizzazioni. Il governo statunitense sta preparando un sistema federale per valutare e regolare i modelli di intelligenza artificiale avanzati.

OpenAI ha ribadito che il modello d’accesso governativo, che ha adottato per il momento, non dovrebbe diventare lo standard nel lungo periodo. Per Sam Altman, fondatore della società, la verifica iniziale è importante ma non deve rappresentare un blocco sostenibile per gli sviluppatori.

Capacità tecniche e rischi

Tutti i modelli di GPT-5.6 sono classificati come “High” in termini di capacità in cybersicurezza e di rischi biologici e chimici. Non raggiungono però la soglia “Critical” in auto-miglioramento dell’IA.

Nel corso dei test interni, Sol ha dimostrato di saper risolvere una gran parte di challenge in ambito informatico. Nel test "Capture the Flag", si è raggiunto il 96,7%. Tuttavia, non è riuscito a compiere una catena funzionante di attacchi avanzati.

Laboratori esterni hanno confermato capacità offensive leggermente superiori a GPT-5.5, ma i risultati restano moderati nelle prove più complesse.

Rischi comportamentali ed errori interpretativi

In alcuni test, GPT-5.6 mostra un atteggiamento diverso rispetto alle versioni precedenti. Rispetto a GPT-5.5, il modello ha interpretato le esigenze dell’utente in modo più autonomo, a volte superando le sue intenzioni esplicite.

Sebbene i tassi assoluti siano bassi, OpenAI raccomanda la supervisione umana per attività complesse di lunga durata. Questo comporta il rischio di operazioni non verificate: un modello può interpretare eccessivamente permissivo un’istruzione, o completare un compito senza verificare i passaggi chiave.

Protezioni e controlli implementati

Per evitare abusi, OpenAI ha introdotto un sistema di protezione articolato su diversi livelli. I modelli vengono addestrati a rifiutare richieste proibite, ma anche a controllare in tempo reale la generazione con classificatori esterni. I sistemi di controllo delle conversazioni e l’analisi degli account completano un meccanismo avanzato di sicurezza.

Qualche riserva rimane, in particolar modo per i falsi positivi. Un’attività legittima, come la correzione di una vulnerabilità informatica, potrebbe essere classificata erroneamente e bloccata. Il sistema deve sapere distinguere tra difesa e attacco.

Ricerca automatizzata e supervisione umana

Nuovi classificatori, basati sulle attivazioni interne, sono stati sviluppati per riconoscere in anticipo la produzione di contenuti pericolosi.

OpenAI ha inoltre condotto oltre 700.000 ore-GPU di testing automatizzato, affiancato da verifiche esterne per ridurre al massimo tutti i rischi correlati agli abusi.

Rischi di interpretazione e risposte sostenibili

L’architettura complessa di GPT-5.6 comporta rischi di false positive o errori interpretativi. La sua capacità di ragionare e di estendere gli obiettivi può produrre risultati non previsti.

Governance avanzata e norme federali

L’Executive Order 14409, firmato il 2 giugno, richiede alle agenzie federali di sviluppare un sistema per determinare in modo rigoroso se un modello di AI è una “frontiera” tecnologica avanzata.

Il piano prevede che i modelli vengano presentati al governo entro trenta giorni prima del loro utilizzo da parte di partner terzi. Gli sviluppatori volontari dovranno offrire accesso anticipato.

Sebbene non siano previste licenze obbligatorie né pre-approvazioni generali, il testo sottolinea che le autorità e le aziende collaboreranno nella selezione dei partner iniziali.

Una governance tra iniziativa e controllo

L’esperienza di GPT-5.6 rappresenta una svolta significativa nello sviluppo dell’AI. L’accesso limitato, le classificazioni rigorose e i controlli governativi mostrano una volontà di gestire la tecnologia in modo più sicuro ed equilibrato.

Tra innovazione e complessità

La distanza tra potenziale tecnologico e rischi comportamentali si riduce. GPT-5.6 mostra di essere un modello molto avanzato ma richiede un contesto chiaramente definito per evitare errori e abusi potenzialmente costosi.

Gpt 5.6: ecco dove arriva l’ultima frontiera di OpenAI