La Crepa nel Muro: Intelligenza Artificiale: alcuni chiarimenti fondamentali

di Walter Quattrociocchi

È difficile parlare di LLM (i large language model come ChatGpt o Gemini) con chiarezza. Il rumore di fondo è terrificante.

Tra marketing, pop–filosofie e metafore che non colgono, il quadro è tutt’altro che rassicurante.

La platea è frammentata in micro–tribù identitarie che si rinforzano a vicenda. Quando la narrativa si schianta contro la realtà, il confirmation bias riporta tutti al punto di partenza e la storia si riaggiusta per tornare comoda.

Dire che gli LLM sono motori statistici non è una provocazione, ma serve a dire che per come sono progettati oggi, l’errore è strutturale, non accidentale.

Quello che producono non è intrinsecamente affidabile: generano testo plausibile, non verità.

Eppure c’è chi li propone come “estensione cognitiva” o li usa come terapeuti, ignorando il problema di fondo...

Un LLM ricombina elementi già visti in base al contesto.

Questo meccanismo, per quanto ottimizzato, ha un margine d’errore fisiologico importante che non è eliminabile con le architetture attuali.

Ignorare questo significa perdersi un bel pezzo della storia. Ammetterlo toglierebbe ai tecnoentusiasti riscattati il loro giocattolo magico. Metterebbe in crisi quella sotto–cultura che si fa sintetizzare paper per darsi un tono, infila “AI e parmigiano” o “AI e buddhismo” nei titoli, e maschera la mancanza di comprensione tecnica e contenuti con metafore fumose.

Dietro la patina retorica resta un algoritmo che sbaglia per design.

E invece il dibattito vira su “crisi dell’antropocentrismo” e la paura della “nuova intelligenza”.

No: gli LLM sbagliano perché sono ricombinatori di testo, e nessun rattoppo o modulo esterno può cambiare questa caratteristica di base.

Il punto non è solo se gli LLM funzionino bene o male oggi. Il punto è che abbiamo creato un sistema che ridefinisce la produzione di conoscenza senza ridefinire i criteri per valutarla.

Questo scarto è il vuoto in cui proliferano le narrazioni salvifiche e le illusioni di comprensione.

Nasce così l’Epistemia: un ecosistema in cui tutti si sentono informati da macchine che allucinano.

Il prodotto finale? Plausibilità confezionata e venduta come conoscenza. Fallata.

Gli investimenti massicci sugli LLM puntano, in larga parte, sulla cosiddetta agentificazione: monetizzare la delega di compiti dagli umani agli algoritmi. Ma se l’errore è strutturale, l’affidabilità resta insufficiente.
Senza affidabilità, la delega crolla.
Senza delega, l’agentificazione non parte.
E senza agentificazione… niente ritorno economico.

Indovinate un po’ come va a finire…

Il livello di distorsione è tale che ho letto davvero: “L’AI, se sbaglia, ci obbliga a pensare. Ed è una cosa ottima.”
Non è satira. L’ho letto davvero.

Un LLM non è un pensatore profondo: è un sistema statistico addestrato su enormi quantità di testo per modellare le regolarità del linguaggio, senza accesso diretto al mondo reale.

Tutto quello che fa è empiricamente descrivibile e riproducibile: nessuna magia, nessuno “spirito” emergente.

Vediamone in dettaglio i pezzi principali.

Correlazione – Due parole sono “amiche” se nei dati compaiono insieme più spesso di quanto accadrebbe per puro caso. Non serve sapere cosa significhino: il modello rileva che “pizza” e “mozzarella” si presentano insieme molto più di “pizza” e “batteria dell’auto” e registra quella regolarità.

Ogni parola viene codificata come un vettore in uno spazio con centinaia di dimensioni; la vicinanza tra vettori riflette la probabilità di apparire in contesti simili. Non c’è semantica innata: è pura mappa statistica estratta dai dati, una geometria delle frequenze.

Processo stocastico – Quando scrive, un LLM non applica logica simbolica o ragionamento causale: genera sequenze di parole campionando dalla distribuzione di probabilità appresa per il contesto dato.

Se il testo è “Il gatto sta…”, la distribuzione assegnerà alta probabilità a “dormendo” e bassa a “pilotando un aereo”. Parametri come temperature, top-ko nucleus sampling introducono variabilità, evitando risposte sempre identiche. È un processo formalmente descritto come catena di Markov di ordine elevato: chi sostiene che “ragiona” deve spiegare in che senso un campionamento condizionato possa costituire ragionamento.

Ottimizzazione – L’abilità dell’LLM non emerge per magia, ma da un processo di minimizzazione di una funzione di perdita (tipicamente la cross-entropy) tra le previsioni del modello e i dati reali.

Attraverso il gradient descent, miliardi di parametri vengono regolati per ridurre sistematicamente l’errore di previsione sul prossimo token. Dopo trilioni di iterazioni, l’output diventa statisticamente indistinguibile dal testo umano. Questo non garantisce verità né comprensione, ma coerenza statistica: l’obiettivo è predittivo, non epistemico.

Transformer – È l’architettura che ha reso possibili gli LLM moderni. Il suo cuore è il self-attention, un meccanismo che, dato un testo, valuta quanto ogni parola sia rilevante rispetto a tutte le altre del contesto, non solo a quelle vicine. Invece di leggere il testo parola per parola (come facevano le vecchie reti neurali sequenziali), il Transformer considera l’intera sequenza in parallelo, calcolando in un colpo solo relazioni a breve e a lungo raggio. Questo permette di mantenere il contesto anche a distanza di molte parole, accelerare l’addestramento e gestire testi molto lunghi senza “dimenticare” parti importanti. È il motore che potenzia la generazione statistica, ma non ne cambia la natura: resta un simulatore di linguaggio, non un processore di significato.

Allucinazioni – Il modello può produrre frasi false ma plausibili perché non confronta le sue uscite con lo stato reale del mondo. L’accuratezza è un effetto sistematico, non un vincolo progettuale. Chiamarle “allucinazioni” è abbastanza imbecille: sono la conseguenza inevitabile di un sistema che ottimizza per plausibilità linguistica, non per veridicità fattuale.

Scaling – La potenza di un LLM non dipende solo dall’architettura, ma dalla scala: più parametri, più dati e più calcolo tendono a produrre modelli più capaci. Questo è il principio delle scaling laws: le prestazioni migliorano in modo prevedibile quando crescono insieme capacità del modello, quantità di dati e tempo di addestramento.

È un fenomeno empirico: allargando la rete e nutrendola di più linguaggio, la mappa statistica diventa più dettagliata.

Ma più grande non significa “più intelligente”: significa solo che il completatore di frasi ha un vocabolario statistico più ricco e preciso — e quindi riesce a sembrare ancora più credibile anche quando si inventa tutto.

La cosa affascinante non è che stia emergendo una mente, ma che siamo diventati capaci di codificare in forma computabile l’intelligenza implicita nel linguaggio. E quel linguaggio, con il suo senso, lo abbiamo generato noi.

Un LLM è il riflesso statistico della nostra produzione linguistica, organizzato così bene da sembrare vivo, ma resta ciò che è: un simulatore di linguaggio umano, non un soggetto cosciente.

L’epistemia non è ignoranza. È peggio. È l’incapacità di accorgersi che qualcosa manca — perché tutto sembra già al suo posto.
Non c’è malafede, non c’è intenzionalità. C’è solo l’effetto collaterale di una tecnologia che genera testo con una precisione sintattica tale da simulare il pensiero umano. Ma senza esserlo.
Il problema non è che la macchina “non capisce”.
Il problema è che noi non ce ne accorgiamo.

Qui l’articolo completo.
Tramite: luogocomune.net

Alcuni articoli correlati:
- L’intelligenza artificiale ha imparato a mentire

- "Specchiarsi": L'Evoluzione dell'Intelligenza Artificiale verso una Consapevolezza simulata