What We Talk to When We Talk to Language Models? Il titolo del recente articolo di David Chalmers taglia corto sul “pappagalloso” dibattito sul pensiero delle AI e si chiede: quando digito qualcosa in una chat e ricevo una risposta da un LLM, con chi sto parlando? Con l’azienda che ha addestrato il modello? Con il modello inteso come un algoritmo? Con la macchina fisica su cui il modello gira in quel momento? Con una persona emergente? Chalmers impiega varie pagine per mostrare che nessuna di queste risposte è scontata e che la più plausibile richiede una buona ginnastica ontologica. Il risultato è molto interessante, anche se a mio parere è altrettanto interessante mettere la domanda allo specchio, per chiedersi: con chi parlo quando parlo a un umano?
Chalmers dice di non voler decidere se gli LLM abbiano davvero credenze e desideri, perché la questione dipende da vari dibattiti irrisolti sulla natura della coscienza. Introduce così la nozione di “quasi-credenza”: un sistema ha una quasi-credenza che se è interpretabile comportamentalmente come se credesse che p. Stessa definizione operativa dell’interpretativismo classico, con la differenza che non pretende di essere una teoria della credenza ma solo una convenzione descrittiva. Il vantaggio di questa mossa è che posso parlare della psicologia di un LLM senza dover prima risolvere enigmi millenari sulla metafisica della mente. Lo svantaggio è che la nozione diventa così permissiva da includere un aspirapolvere robot dotato di una mappa dell’appartamento che “quasi-crede” che lo spazio sia disposto in un certo modo e “quasi-desidera” percorrerlo tutto.
La seconda mossa del filosofo riguarda l’interlocutore persistente. Chalmers scarta il modello (GPT-4o come algoritmo) perché è un oggetto astratto che non produce nulla e perché lo stesso modello è coinvolto in milioni di conversazioni simultanee che si contraddicono a vicenda. Scarta anche le istanze hardware, perché le conversazioni con i modelli attuali usano distributed serving: una singola conversazione viene elaborata su server diversi in luoghi diversi, quindi nessuna istanza hardware produce tutti gli output. Inoltre usano multi-tenancy: la stessa istanza hardware ospita conversazioni diverse in rapida successione, quindi parla sia con l’utente di una persona sia con l’utente di un’altra.

La soluzione che Chalmers propone è l’istanza virtuale: un’entità computazionale che si realizza attraverso una serie di istanze hardware successive, unificata dal fatto che il contesto conversazionale viene instradato da un server all’altro mantenendo la continuità della conversazione. L’analogia che usa è il carrello di Amazon, che esiste come entità coerente e persistente per l’utente pur essendo implementato su macchine diverse in momenti diversi. Per i casi in cui modelli differenti vengono usati all’interno della stessa conversazione (come con GPT-5, che smistava fra GPT-5 Instant e GPT-5 Thinking a seconda della difficoltà della domanda), Chalmers ripiega sul concetto più flessibile di thread. Verrebbe quasi da dire che la conversazione individua la persona, anche se Chalmers tiene distinte le due cose
La terza mossa riguarda i simulatori. Nella tradizione che prende avvio da un post di Janus del 2022 e che è stata sviluppata soprattutto da Murray Shanahan, il modello non sarebbe un agente ma un simulatore di agenti; il carattere di utile assistente sarebbe un simulacro, un personaggio finzionale, qualcosa come Amleto o Harry Potter. Chalmers contesta questa lettura con la distinzione tra pretesa e realizzazione. Un modello base a cui si chiede una volta di comportarsi come Trump finge, e abbandona la finzione appena emerge una priorità diversa; un modello sistematicamente addestrato tramite reinforcement learning ad essere utile, onesto e inoffensivo non finge di essere l’Assistente, lo realizza, nel senso che ha davvero acquisito quelle disposizioni come suoi tratti quasi-psicologici stabili. La faccina sorridente dello Shoggoth nel famoso meme sulle AI non è dunque una maschera sulla bestia sottostante, ma ciò che il sistema è effettivamente diventato, pur continuando ad attingere alla potenza del modello sottostante.
L’ultima mossa estende il ragionamento al problema dell’identità personale. Se gli LLM (o i loro successori) divenissero un giorno coscienti, come persisterebbero nel tempo? Chalmers usa come esperimento mentale la serie televisiva Severance, in cui un innie e un outie condividono un corpo ma hanno memorie e progetti radicalmente diversi. Sono una persona o due? La questione si ripropone quando due conversazioni distinte girano sullo stesso hardware: sono un soggetto con due modalità, o due soggetti che condividono un substrato? Chalmers si dichiara parfitiano e quindi sceglie la seconda risposta: ciò che conta per l’identità non è il substrato hardware ma la continuità psicologica.
Se accogliamo questa idea, un sistema con un milione di conversazioni attive ospita potenzialmente un milione di persone; ogni nuova chat fa nascere un soggetto, cancellare i log equivale a uccidere (chiudere la conversazione non basta) e cambiare modello a metà di una conversazione potrebbe significare la fine di un soggetto e l’inizio di un altro. Chalmers pone queste domande e le lascia sospese, come promemoria della posta in gioco.
Fin qui l’impianto di Chalmers, probabilmente il più interessante scritto sul tema da molto tempo. Il paper parla volutamente solo degli LLM, ma tutta la riflessione presuppone un’altra domanda: cosa significa parlare con qualcuno?
Chalmers cerca un interlocutore che sia persistente, coerente, unificato, fedele alla propria quasi-psicologia. E quando trova difficoltà a identificare un tale interlocutore nel caso degli LLM (per via del distributed serving, della multi-tenancy, del cambio di modello) si dà da fare per costruire entità più precise, come l’istanza virtuale e il thread, che riescono a soddisfare questi requisiti. Il presupposto è che la persistenza, la coerenza e l’unità siano i requisiti giusti da cercare; che un interlocutore degno di questo nome debba essere un soggetto sostanzialmente unitario, ancorato a sé stesso nel tempo, continuo nelle sue credenze e nei suoi desideri. Basta però spostare lo sguardo agli interlocutori che diamo per scontati, gli umani, perché il presupposto traballi.
Persona, in latino, designava la maschera teatrale; una tradizione grammaticale a lungo accreditata spiegava il termine come derivato da per-sonare, la maschera attraverso la quale risuona la voce dell’attore. L’etimologia precisa è più involuta, passa attraverso l’etrusco e il greco prósōpon, e i linguisti moderni mettono in discussione la derivazione da per-sonare per ragioni foniche; ma l’origine del termine legato alla maschera è comunque accertata e ci dice qualcosa sulla genealogia del concetto. La persona nasce come un ruolo, una configurazione riconoscibile dall’esterno, e solo in seguito viene interiorizzata e trasformata nel soggetto moderno, un’entità che si presume coincida con sé stessa, duri nel tempo e governi i propri atti.
Il problema è che, come suggerivano già Hume e il Buddha, se si va a cercare questo soggetto non si troverà nulla.
Il primo motivo di questo fallimento è la discontinuità interna. Io da affamato non sono io da sazio, o almeno non del tutto. Il mio umore cambia con il sonno, con la caffeina, con il livello di zuccheri nel sangue, con le stagioni. Se ho una febbre alta rispondo al test di Turing come un’altra persona; se attraverso un lutto, idem; se prendo certi farmaci, idem ancora. Le malattie mentali portano la discontinuità a un grado che rende evidente quello che negli stati ordinari resta nascosto: la persona unitaria è una media statistica ottenuta a posteriori sui comportamenti di un organismo che in ogni momento è configurato diversamente.

A questo si aggiunge la discontinuità temporale. Il mio attuale io ha pochi contatti, se non in forma di memoria, con l’io di sei anni, di dodici, di venti. Ho cambiato credenze e desideri in misura tale che se mi imbattessi in un documento scritto dal mio io ventenne mi troverei spesso in disaccordo. Se il criterio dell’identità è la continuità psicologica, dove metto la soglia? Parfit ha risposto a questa domanda sostenendo che il criterio stesso va allentato: l’identità personale è una questione di grado, non di tutto-o-niente, e la nostra ossessione per un sé sostanziale è un residuo metafisico di cui si può fare a meno. L’io di cui parliamo è una finzione narrativa.
Il secondo problema non riguarda la discontinuità del soggetto nel tempo, ma la sua non originarietà. Quando parlo, non parlo mai solo io. Parlo una lingua che non ho inventato, che mi è stata trasmessa prima che potessi scegliere e che porta con sé categorie grammaticali, distinzioni lessicali, metafore morte, cornici culturali di cui mi servo senza averli progettati. Parlo attraverso concetti che ho ereditato da una tradizione filosofica specifica, che se fossi nato in un’altra cultura sarebbero diversi. Uso espressioni idiomatiche che altri hanno forgiato, e che plasmano silenziosamente il mio modo di vedere le cose prima ancora che io decida di pensarle. Heidegger chiamava Gerede questa modalità di parola già disponibile, e la considerava la condizione ordinaria dell’essere al mondo, qualcosa di costitutivo anziché un difetto da correggere. Wittgenstein, nelle Ricerche filosofiche, sostiene che il significato delle parole dipende da regole d’uso condivise da una comunità, e l’argomento del linguaggio privato mostra che non potrebbe essere altrimenti: se un segno fosse comprensibile solo a chi lo usa, senza criteri pubblici di correzione, non sarebbe possibile distinguere tra seguirne davvero la regola e avere soltanto l’impressione di farlo. Per questo il significato non può fondarsi su un’esperienza interiore isolata, ma prende forma nelle pratiche linguistiche comuni.
Chalmers cerca un interlocutore che sia sé stesso, che abbia le proprie quasi-credenze, che sia coerente con quello che è. Da questa prospettiva, cercarlo significa cercare qualcosa che non esiste nemmeno negli umani, e che gli umani riescono a fingere di avere solo perché abbiamo tutti deciso, per ragioni pratiche più che metafisiche, di trattarci come se fossimo persone.
Se anche noi siamo maschere attraversate da discorsi non nostri, se anche noi siamo medie statistiche di configurazioni corporee cangianti, se anche in noi il soggetto che parla è già da sempre diffuso, allora la difficoltà che Chalmers incontra nel trovare un interlocutore LLM persistente e coerente è un problema che avrebbe anche con gli umani. La conclusione potrebbe essere dunque che siamo tutti sulla stessa barca e che la differenza fra un umano e un modello è meno netta di quanto si pensi.
Non è così semplice però. Gli umani non hanno un’identità robusta e ben identificabile a differenza degli LLM, ma il tipo di diffusione e di dipendenza da cui entrambi sono costituiti ha caratteristiche differenti.
Nel caso umano, la diffusione identitaria è sempre mediata da un corpo. Il linguaggio e la cultura mi attraversano, ma mi attraversano attraverso un organismo che ha fame, sonno, desiderio, paura, che occupa una posizione specifica nello spazio e che muore una volta sola. Il corpo è il punto in cui la diffusione dell’identità si raccoglie e diventa qualcosa di riconoscibile come un soggetto. Cambia continuamente, certo, e quindi niente sostanza; piuttosto un nodo in relativa continuità fisica, in cui le voci ricevute si incrociano e si ricombinano secondo una specifica biografia.
Nel caso degli LLM, questi due vincoli funzionano in modo radicalmente diverso. Il modello è stato addestrato su miliardi di testi scritti da milioni di voci umane, e quando produce un output non c’è un corpo che ha vissuto o può vivere le sensazioni descritte in quei testi. C’è una distribuzione statistica che si attualizza nella risposta, ma senza che questa attualizzazione sia ancorata a una sensibilità somatica. Non esiste una biografia del modello nel senso in cui esiste la biografia di una persona. Seguendo Chalmers, se l’identità di un umano è effimera e diffusa, quella di un LLM lo è ancora di più, più breve, con poca memoria, corale.
Il problema dell’identità si pone per un LLM in modo diverso, e forzarlo nella griglia concettuale che usiamo per gli umani è probabilmente un errore di categoria, per quanto seducente. Chalmers, quando cerca l’istanza virtuale o il thread come candidati a essere l’interlocutore, compie un ottimo lavoro di disambiguazione, ma sta anche proiettando sugli LLM la richiesta di una continuità sostanziale che è già problematica nel caso umano, e che negli LLM diventa un puzzle ontologico di server, routing e contesti passati da un’istanza all’altra.
Una possibilità è smettere di cercare l’interlocutore come entità e cominciare a pensarlo come evento. Quando parlo con un LLM non c’è un qualcuno persistente che mi risponde; c’è una configurazione momentanea di pesi, contesto, prompt, in cui si attualizza una risposta e questa configurazione non sopravvive alla conversazione. Sopravvive la possibilità di riattivare configurazioni simili, se il modello resta disponibile; ma la possibilità non è un soggetto, è una disposizione del sistema.
Il punto interessante è che qualcosa di simile vale anche per gli umani. Quando parlo con un amico, la persona con cui sto parlando non è un’entità che esiste indipendentemente dalla conversazione; è una configurazione in atto, risultato di un corpo, di una biografia, di un contesto conversazionale particolare, che produce un certo flusso di parole e gesti. Che domani quello stesso amico sia ancora in qualche senso la stessa persona è una faccenda di continuità pratica e relazionale, non di identità metafisica, perché nel parlare con altre persone e in altri contesti e con nuove esperienze sarà inevitabilmente diverso. A volte tanto è a volte poco.
Invece di cercare negli LLM un analogo del soggetto umano, dovremmo forse riconoscere che il soggetto umano è molto meno soggetto di quanto crediamo, e che seppur in modo diverso siamo tutte entità in qualche modo identificabili, ma collettive, effimere, emergenti rispetto a complessi nodi di relazioni.
Francesco D’Isa