L’anonimizzazione dei dati assume un ruolo centrale nell’attuazione del Digital Markets Act, soprattutto per la condivisione delle query di ricerca prevista dall’art. 6(11). Il punto critico riguarda lo standard tecnico-giuridico necessario a ridurre il rischio di re-identificazione

Funzionario del Garante per la protezione dei dati personali, Titolare dell’insegnamento di intelligenza artificiale presso il Dipartimento di Giurisprudenza dell’Università LUISS Guido Carli

L’anonimizzazione è destinata a diventare un tema centrale della compliance in materia di protezione dei dati personali. Se il quadro normativo in evoluzione confermerà una interpretazione sempre più relativa del concetto di dato personale, in cui la qualificazione giuridica del dato dipende dal contesto e, in particolare, dal costo che il soggetto che tratta il dato dovrebbe sostenere per l’identificazione degli interessati – quantificabile, ad esempio, in termini di tempo di ricerca di informazioni o di utilizzo di risorse di calcolo – la prima e più radicale opzione di compliance (e di semplificazione) per i soggetti che trattano dati tenderà a consistere nella dimostrazione che lo scopo da essi perseguito possa essere raggiunto senza alcun trattamento di dati personali, in quanto i dati trattati risultano anonimizzati all’origine contro ogni ragionevole tentativo di re-identificazione.

Questa relativizzazione del concetto di dato personale non è soltanto una novità nel quadro giuridico in materia di protezione dei dati, ma si colloca all’interno di una più ampia trasformazione della regolazione europea dei mercati digitali, esplicitamente orientata a incrementarne il livello di apertura e contestabilità.

In questa prospettiva, il Digital Markets Act (DMA) è il “luogo” nel quale questa architettura regolatoria inizia a prendere forma. Esso infatti introduce un insieme di obblighi rivolti ai c.d. gatekeeper (ossia, motori di ricerca, app store o servizi di messaggistica) per facilitare l’accesso ai dati generati dai loro clienti da parte di soggetti terzi. La condivisione di tali dati, opportunamente anonimizzati, diviene così uno degli strumenti principali attraverso cui il legislatore europeo mira a rafforzare l’apertura e la contestabilità dei mercati digitali.

Letta sistematicamente, questa evoluzione segna un passaggio storico di grande rilievo nella regolamentazione dei settori dell’economia digitale: da forme di unbundling infrastrutturale che si sono sviluppate negli ultimi trent’anni per promuovere l’ingresso di nuovi attori nei mercati digitali, a un progressivo unbundling non infrastrutturale basato sulla condivisione di un asset immateriale come i dati.

Continuità evolutiva del concetto di unbundling

In questa traiettoria è possibile leggere una continuità evolutiva del concetto di unbundling nella regolamentazione dei mercati digitali. La regolazione ha infatti progressivamente spostato il proprio focus dall’infrastruttura fisica (il doppino telefonico, la fibra ottica, i circuiti trasmissivi, fino alle risorse di calcolo e memorizzazione del cloud) alla componente logica e funzionale del sistema e infine ai dati, seguendo lo spostamento del valore economico lungo la catena tecnologica.

Oggi l’estensione del concetto di unbundling ai dati implica nuove considerazioni tecnico-normative e in primo luogo presuppone che attraverso la condivisione dei dati non siano lesi altri diritti, in primo luogo la protezione dei dati personali degli utenti. L’anonimizzazione opera proprio come strumento tecnico che consente tale compatibilità. Essa cessa così di essere soltanto una tecnica di protezione dei dati personali a tutela della loro riservatezza e tende a divenire una condizione di funzionamento dei meccanismi di apertura e contestabilità dei mercati digitali.

Ridistribuzione dello sforzo di compliance

Questo comporta uno spostamento massivo dello sforzo di compliance privacy verso le fasi preliminari del trattamento, in cui l’opzione dell’uso di dati personali è controbilanciata dalla loro sostituibilità con dati effettivamente (anche se magari soltanto relativamente) anonimizzati.

Il primo esempio significativo di tale modello è l’art. 6(11) del DMA, che impone a Google la condivisione a soggetti terzi di dati relativi alle query di ricerca, inclusi ranking, click e visualizzazioni, subordinandola alla previa anonimizzazione dei dati personali degli utenti in esse contenuti.

La disposizione non si limita a prevedere un obbligo di accesso, ma condiziona tale accesso alla trasformazione giuridica del dato. L’art. 6(11) integra così due operazioni non scindibili: apertura del mercato e neutralizzazione della natura personale del dato. L’anonimizzazione non è quindi accessoria, ma diventa condizione costitutiva della circolazione concorrenziale dei dati.

Rappresentanza e significato normativo

Sotto questo profilo, l’art. 6(11) assume un significato che va oltre la disciplina dei motori di ricerca. Esso rappresenta uno dei primi tentativi di costruire un meccanismo di apertura del mercato fondato non più sulla condivisione di infrastrutture fisiche o logiche, ma sulla circolazione di dati resi disponibili per finalità ulteriori rispetto a quelle originarie. In questa prospettiva, l’anonimizzazione tende ad assumere, per l’economia dei dati, una funzione analoga a quella che l’unbundling infrastrutturale ha svolto negli ultimi decenni: rendere accessibile una risorsa essenziale senza compromettere i vincoli giuridici che ne limitano la circolazione.

Modello regolatorio e sua estensione

Questo modello regolatorio implica uno spostamento concettuale rilevante. La compliance in materia di protezione dei dati si radicalizza e diviene un criterio progettuale ex ante. La valutazione sulla sussistenza di trattamenti di dati personali ha luogo nella fase iniziale di condivisione e l’uso di dati personali può essere reso sostituibile da dataset anonimizzati ogniqualvolta ciò sia tecnicamente possibile e idoneo al raggiungimento di uno scopo.

Tale dinamica, non è difficile prevederlo, si estenderà oltre l’applicazione dell’art. 6(11) del DMA, investendo il training degli algoritmi di intelligenza artificiale, la generazione di dati sintetici, la ricerca scientifica e l’advertising, ossia un ampio spettro di casi, da quelli di interesse più generale a quelli più commerciali. L’anonimizzazione, anche intesa nella sua più ristretta accezione relativa, diviene condizione preliminare per una più estesa circolazione dei dati.

Definizione dello standard tecnico-giuridico

Tuttavia, proprio questa centralità introduce un problema: la definizione dello standard di anonimizzazione. Ossia, occorre stabilire quale livello di rischio di re-identificazione sia accettabile.

Il concetto di anonimizzazione è purtroppo spesso malinteso e ricondotto a un problema di sicurezza, cioè a un problema di trasformazione di un dato singolo attraverso l’uso di tecnic