La statistica al tempo del COVID-19

La Fase 2 è ormai vicina: molti Stati sono pronti per provare a riaprire le attività produttive e per consentire ai cittadini una maggiore libertà di movimento. La pandemia, dichiarata ufficialmente dall’OMS1 l’11 marzo 2020, è ancora in corso. Molte domande sul SARS-CoV-2 sono ancora senza risposta e molte altre sono sorte a seguito dell’osservazione dei pazienti e della popolazione. Quali sono le sfide della statistica nell’affrontare l’emergenza Covid-19? 

Statistica e COVID-19

In un contesto complesso qual è appunto quello del coronavirus, un ruolo importante è ricoperto dalla statistica. Considerata come scienza di supporto per la validità di molti studi scientifici, essa è il fondamento quantitativo delle ricerche mediche basate sull’evidenza (Evidencebased medicine). Una recente dichiarazione dell’OMS invita i ricercatori a rendere i dati COVID-19 accessibili, al fine di comprendere gli approcci più efficaci e di valutare il più velocemente possibile l’effetto di terapie adiuvanti o di supporto. La crescita esponenziale di pubblicazioni, definita infodemia, ossia la pandemia di informazioni2, sta portando ad una maggiore necessità di evidenze mediche fondate sulla statistica. 

Il ruolo del bias

Tutto ciò comporta un aumento della responsabilità di chi elabora i dati. I dati COVID-19, sebbene apparentemente simili a qualsiasi dato di studio medico, hanno delle caratteristiche specifiche che se non debitamente valutate possono indurre notevoli bias. La statistica ed i bias sono da sempre concatenati. Leggendo una qualsiasi analisi due domande sorgono immediate e cioè se vi sono dei bias e quali sono. La risposta a questi quesiti farà la differenza tra un risultato valido ed uno completamente inutile. I modelli statistici al tempo del Covid-19 giocano un ruolo fondamentale. Sono modelli complessi e da “maneggiare” con molta cautela; esaminare un fenomeno come quello della pandemia da SARS-CoV-2 richiede infatti confrontarsi con modelli dinamici. 

Caratteristiche degli studi su coronavirus

Gli studi su Covid-19 sono attualmente condotti su due tipologie di individui: i pazienti attivi (ossia quelli ancora in ospedale) ed i pazienti “chiusi” (ossia quelli dimessi o morti). 

Scendendo nel dettaglio degli endpoint primari del COVID-19, quattro sono fondamentali: l’accesso alla terapia intensiva, la ventilazione invasiva, la necessità di supporto per la respirazione, la sopravvivenza. Questi quattro endpoint lavorano tutti con un elemento essenziale: il tempo. Esso agisce come un fattore determinante tra il successo ed il fallimento del trattamento.

Pertanto i modelli statistici e matematici devono necessariamente tenere conto di questa dinamica. I dati clinici sono altamente dipendenti dal tempo e richiedono metodi statistici più performanti di quelli genericamente usati per gli studi medici. Modelli che tengano conto del tempo o meno faranno la differenza tra il successo ed il fallimento della statistica, cioè daranno la risposta o meno all’emergenza coronavirus. Il rischio di bias potrebbe crescere enormemente e la qualità totale degli studi ne risenterebbe a tal punto da inficiare una buona idea di ricerca. 

Studi osservazionali e RCT: attenzione ai bias

Ad esempio un ampio campione, sebbene auspicabile per molti studi, non risolve di per sé il problema dei bias. Uno studio osservazionale condotto in una specifica realtà ospedaliera e che non tenga conto del rapporto dati clinici e tempo non è di per sé esaustivo nello spiegare un fenomeno come il COVID-19. Allo stesso tempo, produzioni frettolose di risultati con studi controllati randomizzati (noti come RCT, ossia randomized controlled trial) possono portare – in un evento così recente come il coronavirus – a conclusioni avventate. Dati non completi o non correttamente randomizzati portano a risultati distorti.

La tempestività e la sintesi sono ottime doti di qualsiasi studio di ricerca, auspicabili specialmente in tema coronavirus. Tali caratteristiche consentono di affrontare correttamente le sfide mediche soltanto se unite alla prudenza, alla qualità e alla serietà dei dati raccolti e del loro successivo trattamento. 

Conclusione

La statistica è protagonista nella ricerca della soluzione Covid-19 insieme alla medicina, all’epidemiologia e a molte altre scienze. Il suo uso deve essere improntato su alti standard qualitativi e di attendibilità della fonte dati e della loro successiva elaborazione. Non sono d’accordo con quelli che affermano che la statistica è un tipo di bugia. Se penso alle molteplici applicazioni statistiche che hanno consentito la cura di molte gravi malattie e che permettono oggi di stabilire una strada per la ricerca di vaccini, terapie e speranze di cittadini e Stati nella battaglia Covid-19, credo che il ruolo di questa scienza debba essere rinforzato, tanto da dover far parte del percorso di apprendimento degli studenti sin dalle prime classi della scuola elementare.

La statistica è figlia della matematica e, esattamente come quest’ultima, ha un solo obiettivo: apprendere e conoscere. Essa non è un Dottor Jekyll e Mister Hide. Penso al contrario che essa sia un Florentino Ariza, il quale impiega 51 anni, 9 mesi e 4 giorni per concretizzare il proprio amore, ma alla fine dimostra che si può avere ragione di un’idea o di un’intuizione di ricerca. Per il Covid-19 dobbiamo aver fiducia nella statistica: aiuterà ricercatori, clinici, operatori sanitari, epidemiologisti e decision-maker per arrivare alla migliore cura e prevenzione e senza attendere mezzo secolo. Questo è certo!

Reference

1. World Health Organization (WHO). https://www.who.int/. Accessed 30 Apr 2020

2. The Lancet. COVID-19: fighting panic with information. Lancet. 2020; 395(10224):537. https://doi.org/10.1016/S0140-6736(20)30379-2

3. Wolkewitz M, Puljak L. Methodological challenges of analysing COVID-19 data during the pandemic. BMC Med Res Methodol. 2020;20(1):81. Published 2020 Apr 14. doi:10.1186/s12874-020-00972-6


Torna in alto