Oltre la RAG: come LLM Wiki può trasformare …

Le basi di conoscenza aziendali spesso falliscono perché nessuno le aggiorna. Le suite enterprise come Microsoft 365 Copilot, costruito su Microsoft Graph, hanno reso più accessibile il patrimonio informativo già presente nei sistemi aziendali, ma non risolvono da sole il problema editoriale della memoria organizzativa: selezionare, collegare, aggiornare e rendere verificabile ciò che l’impresa sa.

Il pattern “LLM Wiki” di Andrej Karpathy propone di affidare a un modello linguistico una parte di questa curatela continua. Non è uno standard industriale né una metodologia validata: è un'ipotesi operativa interessante da verificare in pratica.

Chiunque abbia lavorato in un’azienda di medie dimensioni conosce la scena. Si decide di mettere ordine nella conoscenza interna. Si sceglie uno strumento, si nomina un responsabile, si caricano i primi documenti con entusiasmo. Per qualche settimana le pagine crescono. Poi le priorità cambiano, e nessuno aggiorna più nulla. Sei mesi dopo la wiki contiene un cimitero di documenti che nessuno apre, perché nessuno si fida che siano attuali.

Il problema è strutturale. Il valore di una base di conoscenza cresce con il numero di pagine, ma il costo di manutenzione cresce spesso più in fretta, perché ogni informazione nuova può rendere obsolete quelle vecchie, può richiedere nuovi collegamenti, può contraddire qualcosa scritto prima. Arriva il punto in cui tenere tutto coerente costa più del beneficio percepito, e a quel punto le persone smettono. Karpathy lo formula così: gli esseri umani abbandonano le wiki perché il peso della manutenzione cresce più velocemente del valore che ne ricavano.

Aggiornare i riferimenti, tenere allineate le sintesi, annotare quando un dato nuovo smentisce un’affermazione vecchia, mantenere coerenti decine di pagine è lavoro ripetitivo che le persone competenti tendono a rimandare. Ed è anche un terreno in cui un modello LLM può essere utile, perché può rileggere, ricombinare e aggiornare molti file autonomamente. Può però farlo in modo affidabile solo se le fonti sono tracciate e se qualcuno resta responsabile della qualità finale.

Negli ultimi anni le grandi suite hanno fatto passi avanti concreti. Microsoft 365 Copilot poggia su Microsoft Graph, che indicizza semanticamente dati e segnali dell'ambiente Microsoft 365 e consente al modello di rispondere tenendo conto dei contenuti pertinenti a cui l'utente è autorizzato ad accedere. Strumenti analoghi esistono in casa Google, con Gemini integrato in Workspace. Per un knowledge worker il guadagno si vede subito: fa una domanda e riceve una risposta sintetica con i riferimenti alle fonti.

Funziona, ma ci sono dei limiti. La ricerca recupera i frammenti rilevanti nel momento della domanda e li sintetizza in una risposta. Tecnicamente si basa sul meccanismo RAG (retrieval augmented generation), che combina un modello generativo con una memoria esterna che viene consultata prima della risposta. Però non accumula conoscenza: ogni query riparte quasi da zero. Karpathy propone invece di far leggere le fonti all’LLM, estrarne la conoscenza e integrarla progressivamente in una wiki strutturata, interconnessa e mantenuta nel tempo. In questo modo sintesi, contraddizioni, relazioni tra concetti e riferimenti non vengono ricostruiti ogni volta, ma diventano artefatti persistenti.

La ricerca enterprise nasce per trovare, sintetizzare e contestualizzare informazioni presenti nei sistemi aziendali; non crea pagine dedicate alle entità ricorrenti, non traccia esplicitamente legami tra gli argomenti, non segnala quando due fonti si contraddicono. Manca il sistema di note interconnesse sul quale in definitiva si basano le wiki, dove il valore sta nei legami che attraversano le note e nelle idee che da quei legami emergono, più che nelle note prese separatamente.

Microsoft Graph può aiutare a rispondere alla domanda “dove ho parlato di questo cliente?”, nel perimetro dei dati e dei permessi Microsoft 365. Diverso è costruire e tenere viva una pagina “cliente” che raccolga, colleghi e aggiorni nel tempo tutto ciò che l’azienda sa su di lui, mettendo in evidenza le tensioni tra informazioni di fonti diverse. La prima cosa è ricerca assistita; la seconda è memoria strutturata. Molte aziende oggi hanno strumenti sempre migliori per la prima e rischiano di scambiarli per la seconda.

La differenza riguarda soprattutto la visibilità. Un conto è che un’informazione sia presente implicitamente nella memoria semantica di un sistema, raggiungibile solo se qualcuno formula la domanda giusta; un altro è che sia visibile e navigabile per una persona. Quando la conoscenza è esposta in un artefatto che si può sfogliare, la risposta a volte previene la domanda: vedendo la pagina si scopre ciò che non si sapeva di dover chiedere. Quando invece resta latente, recuperabile solo su interrogazione esplicita, la domanda potrebbe non nascere affatto, e l’informazione, pur essendoci, è come se non ci fosse.

Andrej Karpathy, già responsabile dell’intelligenza artificiale in Tesla e tra i fondatori di OpenAI, ha pubblicato su GitHub nell’aprile del 2026 un documento breve intitolato LLM Wiki. LLM Wiki non è un software, non è uno standard, non è una ricerca peer-reviewed e non dimostra empiricamente che questo approccio sia superiore alle alternative. È un “idea file”, pensato per essere consegnato a un agente AI come ClaudeCode, Codex o strumenti simili, che poi lo adattano insieme alla persona e al dominio. Proprio per questo è interessante: non vende una piattaforma, descrive un pattern operativo.

Invece di interrogare ogni volta i documenti grezzi, il modello costruisce e mantiene in modo incrementale una wiki persistente, cioè una raccolta strutturata e interconnessa di file di testo di tipo Markdown che si frappone tra la persona e le fonti originali. Quando arriva una fonte nuova, il modello la legge, ne estrae le informazioni chiave, le integra nelle pagine esistenti, rivede le sintesi dei temi, annota dove il dato nuovo contraddice un’affermazione precedente. La conoscenza viene compilata e tenuta aggiornata, invece di essere derivata di nuovo dalla ricerca a ogni interrogazione.

La wiki è un artefatto che si compone nel tempo. I riferimenti incrociati sono già al loro posto, le contraddizioni già segnalate, la sintesi già allineata a tutto quello che si è letto, e l’insieme si arricchisce a ogni fonte aggiunta.

L’architettura proposta da Karpathy è volutamente semplice e si articola su tre livelli. Le fonti grezze sono la collezione curata di documenti originali, articoli, verbali, dati: restano immutabili, il modello le legge senza toccarle, e costituiscono la fonte di verità. La wiki è la cartella di file Markdown generati dal modello, fatta di sintesi, pagine di entità, pagine di concetti, confronti, una panoramica generale: questo strato viene elaborato oper

Oltre la RAG: come LLM Wiki può trasformare la memoria d'impresa