L’espansione dell’intelligenza artificiale sembra proporre alla ricerca clinica una storia rassicurante: che intercetterà i nostri errori, affinerà le analisi, colmerà quello che manca, salverà gli studi che altrimenti finirebbero fuori rotta. È una storia confortante. Ma anche capovolta.
L’AI è un valido supporto, ma non può e non deve diventare chi decide al nostro posto. Sono algoritmi matematici: ricombinano e riorganizzano ciò che già esiste, a grande velocità e con apparente sicurezza, ma non generano conoscenza nuova nel senso in cui la intendiamo noi: un’intuizione, un’ipotesi, un nesso causale che prima non c’era. Si comportano piuttosto come uno specchio. Restituiscono il ragionamento che gli consegniamo. Se quel ragionamento è solido, lo elaborano in modo potente. Se non lo è, elaborano con la stessa efficienza anche le sue lacune.
C’è una tentazione crescente e comprensibile: affidare all’AI l’intero percorso di ricerca. Il disegno dello studio, la scelta del modello, l’analisi statistica, persino la scrittura del paper. Un assistente che non si stanca, non sbaglia un layout, non dimentica una citazione (magari la sbaglia, ma non la dimentica). Ma c’è una differenza tra delegare l’esecuzione e delegare il pensiero. La prima fa risparmiare tempo. La seconda costa la validità dello studio, e quasi sempre nessuno se ne accorge prima delle critiche dei revisori.
Uno schema che vale la pena notare
Passando abbastanza tempo dentro i dataset clinici, ci si accorge, anche solo a livello intuitivo, dell’emergere di uno schema. Studi in cui l’endpoint primario non è mai stato definito con chiarezza. Trial in cui nessuno si è fermato a chiedersi a quale domanda l’analisi dovesse davvero rispondere. Manoscritti in cui la sezione dei metodi è stata scritta dopo aver visto i risultati, non prima: una giustificazione costruita a ritroso per far quadrare i numeri.
Niente di tutto questo è nuovo. Ciò che è nuovo è lo strato che oggi sovrapponiamo: modelli più rapidi, più sofisticati e, quando le fondamenta non reggono, altrettanto sbagliati. Solo che ora l’errore arriva splendidamente formattato.
Efficienza non è sinonimo di validità
Uno studio disegnato male non diventa uno studio disegnato bene perché un algoritmo lo ha elaborato. Il difetto sta a monte del calcolo. L’AI lo attraversa semplicemente in modo più efficiente, producendo un output che appare più autorevole proprio perché è più rifinito.
È qui il rischio silenzioso. Un’analisi maldestra si annuncia da sola: il codice che non gira, la tabella che non torna, il revisore che storce il naso. Il problema è l’altro caso, quello in cui tutto sembra tornare. I numeri ci sono, ma nascondono un bias, e un lettore attento si accorge che si tratta di risultati ammantati di matematica.
Perché la matematica è esatta solo se la si applica correttamente: la presenza di numeri non rende esatto un risultato, così come un’equazione ben scritta non garantisce che descriva la domanda giusta. Un’analisi sofisticata costruita su una domanda indefinita ha la forma del rigore senza la sostanza. Ed è esattamente in quella distanza che si prendono decisioni fondate su una falsa sicurezza.
Lo stesso vale per il testo. Un modello linguistico può scrivere una sezione dei metodi impeccabile per un’analisi che nessuno ha davvero ragionato, una discussione persuasiva attorno a un risultato che è soltanto un artefatto. La prosa è pulita, le frasi scorrono, i tempi verbali sono corretti. E proprio per questo è più difficile vedere che sotto non c’è niente.
Le cinque domande che vengono prima dello strumento
Prima di qualsiasi modello, di qualsiasi pipeline, di qualsiasi metodo ingegnoso, ci sono domande poco affascinanti e non negoziabili. Sono cinque, e nessuno strumento può rispondere al posto nostro.
Cinque domande chiave
- Che cosa stiamo davvero cercando di rispondere? Non in modo approssimativo: con precisione. Una domanda vaga produce, nella migliore delle ipotesi, una risposta vaga; più spesso, una risposta precisa alla domanda sbagliata.
- Qual è la popolazione target, e i dati che abbiamo davanti la rappresentano davvero? Un campione non diventa una popolazione perché lo trattiamo come tale. Chi è entrato, chi è rimasto fuori, chi è uscito per strada: ogni assenza è un’ipotesi nascosta.
- Che forma ha l’estimando? Il framework ICH E9(R1) esiste proprio per questo: ci obbliga a specificare, prima di toccare i dati, quale effetto del trattamento intendiamo stimare, in chi e tenendo conto di quali eventi intercorrenti. Un estimando non è altro che la disciplina di dare un nome alla domanda prima di cercare la risposta.
- Che cosa abbiamo deciso prima di vedere i dati? Qui si gioca quasi tutto. Quali analisi sono confermative e quali esplorative, quante ipotesi stiamo testando e come ne teniamo conto, che cosa faremo dei dati mancanti. Un’analisi decisa guardando i risultati non è un’analisi: è una narrazione. E un modello capace di generare cento varianti in un pomeriggio rende questa distinzione più urgente, non meno. La sezione dei metodi va scritta prima, come impegno, non dopo, come alibi.
- Sapremmo difendere ogni scelta e ogni frase senza lo strumento che l’ha prodotta? È il vero test. Se non sappiamo spiegare perché quel modello, quella covariata, quella formulazione, allora non è la nostra analisi: è quella dell’AI, e la stiamo soltanto firmando. La responsabilità davanti a un comitato etico, a un revisore, a un paziente, non è delegabile.
Se quel ragionamento è solido, l’AI diventa davvero potente. Può accelerare il disegno, far emergere strutture nei dati che ci sarebbero sfuggite, rafforzare l’analisi e sostenere il percorso verso la pubblicazione lungo l’intera pipeline. Lo strumento amplifica il pensiero.
Se quel ragionamento non è solido, lo strumento potenzia anche quello. E ciò che si ottiene è un nonsenso impeccabilmente confezionato.
Il rigore si decide prima
La soluzione non è meno tecnologia. È mettere prima le domande difficili e rifiutarsi di lasciare che la sofisticazione dello strumento prenda il posto della solidità del disegno. Il rigore non è qualcosa da aggiungere in fase di analisi. È qualcosa che si decide in fase di protocollo e si onora fino in fondo.
Chi si appoggia all’AI per fare tutto, dalla statistica al paper, non sta correndo solo un rischio tecnologico. C’è un problema più serio, ed è etico. Una ricerca così non produce nuova evidenza. Riorganizza ciò che già esiste e lo presenta come scoperta. È il gioco delle tre carte, quello dei truffatori di strada. Punti sulla carta che credi vincente, le mani corrono veloci, ma la carta giusta non la trovi mai, perché il risultato era deciso prima che cominciassi a guardare. E come in quel gioco, qualcuno resta ingannato. Non solo il revisore che fa passare il lavoro o il clinico che vi costruisce sopra una decisione. Ad essere ingannato è l’intero mondo della ricerca, che accoglie come conoscenza ciò che è solo apparenza e ci edifica sopra altri studi, altre revisioni, altre linee guida. Un’evidenza finta non resta un errore privato: entra nella letteratura e da lì nelle scelte che riguardano i pazienti.
Conclusione
L’AI non è il problema della ricerca clinica. Non lo è mai stata. È uno strumento, e gli strumenti fanno quello per cui li usiamo. Il problema, da sempre, è a monte. L’assenza di una domanda ben posta e di un approccio rigorosamente logico, fondato sulla conoscenza, quella vera, non quella degli algoritmi. Mettiamo a fuoco la domanda, decidiamo prima cosa vogliamo davvero sapere e a quali condizioni, e allora gli strumenti, vecchi e nuovi, avranno finalmente qualcosa di solido su cui lavorare. La differenza tra produrre conoscenza e farne il verso non sta nell’algoritmo. Sta in chi lo guida.
