Stai conducendo uno studio osservazionale multicentrico. Ti è mai capitato di trovarti con i dati raccolti da più centri e accorgerti che ogni centro li ha registrati in modo leggermente diverso?
Non è un errore. È la realtà degli studi osservazionali multicentrici. E quella realtà, se non viene affrontata con metodo prima di aprire il software di analisi, trasforma settimane di lavoro clinico in un manoscritto che non regge al primo ciclo di peer review.
Questo caso studio descrive com’è andata con uno studio su pazienti con fibrillazione atriale non valvolare in terapia anticoagulante orale, seguiti per 12 mesi in diversi centri cardiologici. Oltre mille pazienti, outcome multipli da analizzare, un dataset eterogeneo e, nessun piano statistico formale ancora scritto.
Il momento in cui abbiamo aperto il dataset
Il gruppo di ricerca ci ha contattati con il dataset già assemblato e gli obiettivi clinici chiari: stimare l’incidenza di stroke/TIA ischemico e di sanguinamento maggiore, identificare i predittori di evento a 12 mesi.
La prima analisi esplorativa ha confermato quello che ci aspettavamo e che quasi nessun team osservazionale anticipa davvero:
- La stessa variabile clinica era codificata come campo numerico in alcuni centri, come stringa testuale in altri. Prima di qualsiasi modello, serviva una riconciliazione sistematica.
- I dati mancanti non erano distribuiti casualmente. Il centro con il sistema informatico più datato aveva il 23% di missing su una variabile di rischio. Una distribuzione che esclude l’imputazione semplice e richiede scelte metodologiche esplicite.
- I criteri di inclusione ed esclusione erano stati applicati in modo leggermente difforme tra i siti. Alcune discrepanze erano risolvibili; altre richiedevano una decisione formale di protocollo.
Prima di eseguire una singola analisi, era necessario decidere cosa fare di tutti questi casi e documentare ogni decisione in modo che risultasse difendibile davanti a un revisore metodologicamente preparato.
Il deliverable che nessuno aveva richiesto e che ha cambiato tutto
Il primo documento che abbiamo prodotto non era un’analisi statistica. Era un piano di analisi statistica (SAP) retrospettivo. In ambito osservazionale è uno strumento spesso sottovalutato, perché lo studio è già chiuso e sembra inutile pianificare qualcosa che in teoria si può fare direttamente. È un errore di prospettiva.
Il SAP serve a due motivi precisi. Primo, esso rende esplicite tutte le scelte metodologiche che, se lasciate implicite, diventano bersagli nelle revisioni. Secondo: quando i co-autori sono in centri diversi, il SAP è l’unico documento che garantisce che tutti stiano parlando dello stesso studio.
Nel SAP abbiamo definito: gli outcome secondo criteri ISTH e AHA/ASA, la strategia di imputazione multipla con metodo PMM per i valori missing at random, l’approccio alla variabilità intercentro con effetti fissi e verifica mista, e la lista prespecificata delle covariate per il modello multivariato.
Con il SAP scritto, ogni scelta successiva era già giustificata. Senza, ogni scelta sarebbe sembrata post hoc.
Due settimane di data cleaning. Non è un’anomalia: è la norma.
Chi lavora per la prima volta su uno studio multicentrico di solito stima questa fase in tre o quattro giorni. Chi ci lavora regolarmente sa che almeno due settimane sono la norma, non l’eccezione. Abbiamo lavorato su tre livelli in parallelo:
- Riconciliazione delle codifiche: ogni variabile analizzata è stata confrontata centro per centro. Le discrepanze sono state segnalate ai data manager locali. Ogni correzione è stata documentata con versioning. Nulla è stato cambiato silenziosamente.
- Gestione dei missing data: dopo la riconciliazione, i record problematici si sono ridotti significativamente. Quelli con missing sull’outcome primario sono stati esclusi per protocollo. I restanti sono stati inclusi nell’imputazione multipla. La popolazione analitica finale ha superato quota mille pazienti.
- Verifica della coerenza longitudinale: in studi con follow-up, le date degli eventi devono essere coerenti con le date delle visite. In sei casi abbiamo rilevato incongruenze che richiedevano un chiarimento clinico diretto con il centro.
Nessuno di questi passaggi compare nella sezione Metodi del manoscritto. Ma senza di essi, qualsiasi risultato pubblicato avrebbe avuto una base instabile.
Perché il modello di Cox da solo non bastava
Con il dataset validato, l’analisi ha seguito la struttura del SAP. Ma il passaggio metodologico più rilevante era uno solo: la scelta del modello per il sanguinamento maggiore.
In presenza di rischio competitivo con la mortalità — i pazienti che muoiono per altra causa non possono più sanguinare — il modello di Cox standard sovrastima il rischio dell’evento di interesse. È un errore frequente, spesso invisibile ai revisori clinici e immediatamente visibile a quelli metodologici.
Abbiamo applicato il modello di Fine e Gray. Non perché sia più complesso, ma perché in questo contesto era l’unica scelta corretta. La differenza tra un’analisi robusta e una semplicistica, in questo studio, stava esattamente qui.
Per l’outcome primario — lo stroke/TIA ischemico — il modello di Cox era invece la scelta appropriata: in assenza di un rischio competitivo clinicamente rilevante per quell’endpoint, le assunzioni del Cox sono soddisfatte. Abbiamo verificato la proporzionalità dei rischi con il test di Schoenfeld e utilizzato curve di Kaplan-Meier per la rappresentazione dell’incidenza cumulativa.
Applicare modelli diversi a outcome diversi non è incoerenza: è precisione. Per verificare la stabilità complessiva dei risultati rispetto alla struttura multicentrica, abbiamo replicato l’analisi primaria con un modello misto a effetti casuali con centro come effetto random. I risultati erano stabili.
STROBE non è burocrazia.
Conclusa la fase analitica, abbiamo supportato la stesura del manoscritto con un approccio preciso: anticipare le domande dei revisori, non risponderle a posteriori.
La checklist STROBE ha guidato la struttura della sezione Metodi. Ogni item è stato verificato e mappato sulla sezione corrispondente. Questo passaggio — formalmente opzionale — riduce in modo misurabile la probabilità di ricevere revisioni che chiedono chiarimenti già presenti nel testo ma non esplicitati con sufficiente chiarezza.
Abbiamo anche costruito una tabella supplementare di trasparenza metodologica, sempre più richiesta nelle riviste cardiovascolari: un documento che sintetizza le decisioni di analisi, le loro motivazioni e i risultati delle analisi di sensitività. Non per lunghezza, ma per solidità.
RIEPILOGO DELLO STUDIO
| Disegno | Osservazionale retrospettivo multicentrico |
| Popolazione | Pazienti con FANV in terapia anticoagulante orale |
| Follow-up | 12 mesi |
| Pazienti analizzati | Oltre 1.000 (dopo esclusioni per qualità del dato) |
| Outcome primario | Stroke/TIA ischemico a 12 mesi |
| Outcome secondario | Sanguinamento maggiore (criteri ISTH) |
| Standard di reporting | STROBE |
| Modelli statistici | Kaplan-Meier · Cox · Fine-Gray · Modello misto |
Quello che si ripete ogni volta
Ogni studio osservazionale multicentrico ha le sue specificità. Ma alcune costanti si presentano con una frequenza tale da meritare di essere dette esplicitamente, perché chi non le ha ancora incontrate le incontrerà.
- Il data cleaning in un dataset multicentrico richiede sempre più tempo di quanto stimato. La documentazione delle decisioni prese in questa fase vale quanto l’analisi nel momento in cui arrivano i revisori.
- La variabilità inter-centro non è un problema da nascondere o eliminare. È un elemento strutturale da modellare correttamente. Ignorarla non la fa sparire: la rende indifendibile.
- Il rischio competitivo è sistematicamente sottovalutato negli studi con outcome multipli. Usare il Cox dove si dovrebbe usare il Fine-Gray non è una scelta conservativa: è un errore metodologico.
- Anticipare la trasparenza metodologica — SAP, STROBE, tabelle supplementari — non è lavoro in più. È lavoro che si fa prima invece che sotto pressione durante la revisione.
Come siamo entrati in questo studio
Non siamo stati coinvolti in fase di disegno dello studio. Il protocollo era chiuso, i dati erano stati raccolti, alcune analisi descrittive erano già state avviate.
È una situazione molto comune nei nostri interventi e non è un problema in sé. Il punto critico non è quando si entra, ma come. Il lavoro metodologico retroattivo — SAP, data cleaning sistematico, scelte di modellazione esplicite — deve essere fatto con lo stesso rigore di quello prospettico. La differenza tra uno studio che regge alla peer review e uno che non la regge può non dipendere dall’analisi in sé. Dipende dalla solidità del processo che la precede.
Quello che ha reso possibile questo tipo di intervento non è solo la competenza statistica. È la capacità di parlare la lingua del ricercatore clinico. Capire cosa significava clinicamente quel 23% di missing su una variabile di rischio, ragionare con i cardiologi sulla plausibilità delle date incongruenti, spiegare la scelta del Fine-Gray senza separare il modello dal contesto dell’outcome. La statistica applicata alla ricerca clinica non funziona se chi la fa non conosce il terreno su cui sta lavorando. È questa dualità — rigore metodologico e comprensione clinica — che distingue un contributo tecnico da una collaborazione scientifica.
In questo studio, il contributo di Mathsly Research ha coperto: SAP retrospettivo, data cleaning e integrazione del dataset, analisi statistica completa con modellazione del rischio competitivo, supporto alla redazione della sezione Metodi e della discussione dei limiti, revisione STROBE, tabella supplementare metodologica.
Esito del nostro intervento? Il manoscritto è stato sottomesso con una sola revisione maggiore, relativa alla discussione di un sottogruppo, non a criticità metodologiche.
