Negli ultimi anni la ricerca biomedica si è trovata ad affrontare un problema strutturale sempre più evidente: pur con l’aumento esponenziale dei dati sanitari prodotti ogni giorno nelle strutture sanitarie, l’effettiva utilizzabilità di questi dati per scopi di ricerca si è andata riducendo. Il problema non riguarda solo la quantità, ma soprattutto la capacità di utilizzare quei dati in modo efficiente e conforme alla normativa, in particolare al Regolamento Generale sulla Protezione dei Dati (GDPR) dell’Unione Europea.

Limiti del GDPR nella sanità

Il GDPR è stato progettato per proteggere la privacy dei cittadini europei, e ha introdotto severe restrizioni sulla raccolta, conservazione e utilizzo dei dati personali. I dati sanitari, ritenuti particolarmente sensibili, sono tra quelli più regolamentati. Questo quadro normativo complesso ostacola la condivisione e l’analisi di dati sanitari, che invece potrebbero accelerare la ricerca scientifica, migliorare la salute pubblica e supportare l’innovazione farmaceutica.

Tra i principali ostacoli, la frammentazione dei dati, la necessità di anonimizzazione rigorosa e la difficile collaborazione tra soggetti diversi, inclusi istituti di ricerca, ospedali e aziende private. I dati, spesso conservati in sistemi non interoperabili, non sono facilmente condivisibili, limitando la capacità di produrre analisi quantitative robuste.

I dati sintetici: un cambio di prospettiva

In questo scenario entra in gioco la tecnologia basata sull’Intelligenza Artificiale (AI) che sta apportando un nuovo paradigma: la produzione di dati sanitari sintetici. I dati sintetici non contengono informazioni reali su pazienti, né sono semplici pseudonimi di dati esistenti, ma vengono generati algoritmica e statisticamente in modo da replicare i tratti principali dei dati originali. Questo permette di condurre analisi approfondite senza mettere a rischio la privacy.

I dati sintetici non violano il GDPR e rispettano gli standard di protezione dei dati. Inoltre, consentono una maggiore flessibilità nell’uso, facilitando collaborazioni di ricerca internazionali, test di algoritmi e simulazioni che altrimenti sarebbero impossibili con dati reali.

Esempi di applicazione

L’uso dei dati sintetici è già applicabile in diversi ambiti. Ad esempio, in oncologia, i ricercatori possono simulare risposte a diversi tipi di terapia usando dati sintetici rappresentativi di gruppi di pazienti. Questo permette di testare ipotesi prima di applicarle in ambito clinico.

Nel campo dell’intelligenza artificiale medica, i dati sintetici sono utilizzati per addestrare algoritmi diagnostici. Essendo disponibili in grandi quantità e senza rischi per la privacy, permettono di migliorare la capacità predittiva delle macchine. Per esempio, sistemi di AI possono essere addestrati a riconoscere segni precoci di diabete o di malattie cardiovascolari.

Vantaggi scientifici ed economici

Più in dettaglio, i vantaggi del ricorso ai dati sintetici includono:

Ridisegnare l'infrastruttura digitale della salute

Se opportunamente implementati, i dati sintetici potrebbero rappresentare un cambio di infrastruttura fondamentale nel settore sanutario. I sistemi sanitari nazionali potranno beneficiare di una maggiore capacità di analisi, migliorando le decisioni basate sui dati, le politiche sanitarie e la fornitura di servizi sanitari.

Inoltre, il ricorso ai dati sintetici spinge verso un modello di sanità digitale più aperta, dove i vincoli privacy non frenano la condivisione di valori e scoperte, ma ne facilitano l’accelerazione.

Prospettive future

Sebbene i dati sintetici rappresentino un’opportunità enorme, la loro adozione su grande scala richiede investimenti in infrastrutturi digitali e formazione del personale sanitario. Solo con una visione strategica da parte dei governi e delle organizzazioni di settore, potremo superare i limiti attuali e ottenere grandi benefici in campo scientifico, sociale e economico.