Il calcolo della dimensione campionaria è uno dei passaggi più sottovalutati della progettazione di uno studio clinico. Viene spesso trattato come un’operazione tecnica da sbrigare in fretta per completare il protocollo. In realtà è una delle decisioni metodologiche con le conseguenze più durature: un campione mal calcolato compromette lo studio prima che inizi.
Perché il calcolo del campione non è una formalità
La dimensione campionaria determina la capacità dello studio di rilevare un effetto reale, se esiste. Uno studio sottodimensionato non è solo uno studio con meno potenza: è uno studio che rischia di produrre risultati falsi negativi, di non rispondere alla domanda di ricerca e di non reggere al giudizio dei reviewer o dell’ente regolatorio.
Uno studio sovradimensionato, al contrario, non è semplicemente “più sicuro”: espone un numero non necessario di pazienti al trattamento sperimentale, aumenta i costi e i tempi senza valore aggiunto metodologico. In entrambi i casi, le conseguenze sono difficilmente recuperabili a studio avviato.
Il problema non è la formula: sono le assunzioni
Qualsiasi software statistico può calcolare una sample size in pochi secondi. Il punto critico non è il calcolo: è la scelta delle assunzioni su cui il calcolo si basa. Tre assunzioni determinano quasi interamente il risultato:
- L’effect size atteso, ossia la differenza minima clinicamente rilevante (MCID) che lo studio deve essere in grado di rilevare. Sovrastimarla produce studi sottodimensionati; sottostimarla produce studi inutilmente grandi.
- La variabilità stimata dell’endpoint primario, da derivarsi da studi pilota o dalla letteratura, spesso con incertezza non documentata.
- Il tasso di dropout atteso che modifica il numero di soggetti da arruolare per mantenere la potenza pianificata.
Se queste assunzioni non sono esplicitate, giustificate e documentate nel protocollo, il calcolo della sample size non ha valore metodologico, indipendentemente dalla precisione numerica del risultato.
I cinque errori più frequenti che vediamo in fase di revisione
1. Effect size ottimistico senza giustificazione
L’errore più comune. Si sceglie un effect size che produce una sample size gestibile, non un effect size giustificato dalla letteratura o dalla clinica. Il risultato è uno studio che ha potere adeguato solo per un effetto molto più grande di quello realisticamente atteso. Se l’effetto reale è più piccolo, come quasi sempre accade, lo studio non ha la potenza per rilevarlo.
2. Variabilità derivata da popolazioni non comparabili
La deviazione standard usata nel calcolo è presa da uno studio pubblicato su una popolazione diversa (e.g., diversa per età, comorbilità, trattamenti concomitanti). La variabilità stimata non riflette la variabilità della popolazione dello studio in corso ed il calcolo risultante è sistematicamente sbagliato.
3. Dropout non considerato o sottostimato
Il calcolo produce il numero di soggetti completatori necessari, non il numero di soggetti da arruolare. La differenza tra i due dipende dal tasso di dropout atteso. Trascurarlo o sottostimarlo produce studi con un numero insufficiente di osservazioni complete con conseguente perdita di potenza non recuperabile.
4. Mancata correzione per confronti multipli
Quando lo studio ha più endpoint primari o più confronti pianificati, il calcolo della sample size deve tenerne conto attraverso le appropriate correzioni (Bonferroni, Holm, o metodi più sofisticati per endpoint multipli correlati). Ignorarle produce uno studio con un rischio di errore di tipo I superiore a quello dichiarato.
5. Assunzioni non documentate e non aggiornate
Le assunzioni usate nel calcolo non compaiono nel protocollo con la loro giustificazione o vengono aggiornate durante lo studio senza documentare la modifica e le sue implicazioni sulla potenza. Il risultato è un calcolo che non può essere verificato e difeso davanti a un reviewer o a un ispettore GCP.
Cosa deve contenere una sezione sample size difendibile
Una sezione sample size che regge al giudizio di un reviewer statistico o di un ente regolatorio deve includere:
- La domanda statistica precisa: test di superiorità, non-inferiorità o equivalenza, con il margine specificato
- L’effect size atteso con la fonte e la giustificazione clinica della scelta
- La variabilità stimata con la fonte (studio pilota, letteratura, clinical judgment) e la sua incertezza
- Il livello di significatività (α) e la potenza (1-β) scelti accompagnati da una motivazione nel caso non siano i valori standard
- Il tasso di dropout atteso e la sua giustificazione
- Il numero finale di soggetti da arruolare (non solo i completatori)
- L’analisi di sensitivity della sample size al variare delle assunzioni principali
Quest’ultimo punto è spesso omesso ed è quello che i reviewer statistici più esperti chiedono quasi sistematicamente. Se le assunzioni cambiano del 20%, la potenza rimane accettabile? La risposta a questa domanda dice molto sulla solidità del disegno.
Quando è il momento giusto per rivedere il calcolo
Il calcolo della sample size non è necessariamente un’operazione una tantum. Ci sono momenti specifici in cui una revisione è non solo utile ma necessaria:
- Prima della submission al comitato etico per verificare che le assunzioni siano documentate e difendibili.
- In fase di analisi interim quando i dati parziali possono suggerire una variabilità diversa da quella attesa, accompagnando il calcolo con le appropriate procedure di blinded sample size re-estimation previste dal protocollo.
- Quando cambia l’endpoint primario, anche parzialmente. Qualsiasi modifica all’endpoint primario o alla sua definizione richiede un aggiornamento del calcolo e una sua documentazione formale come emendamento al protocollo.
- Prima di una submission regolatoria, come parte di un audit metodologico del dossier, per verificare che il calcolo sia coerente con il SAP e con le analisi effettivamente condotte.
Un calcolo della sample size corretto non è un numero: è un ragionamento documentato. Le assunzioni devono essere esplicitate, giustificate e sensibili alla variazione. Il calcolo deve essere coerente con il SAP e con le analisi pianificate. E deve essere leggibile da un reviewer che non conosce il contesto dello studio — perché probabilmente non lo conosce.
Mathsly Research supporta la progettazione statistica degli studi clinici: calcolo della sample size, giustificazione delle assunzioni, analisi di sensitivity e SAP pre-specificato. Output pronti per submission regolatoria e comitato etico.
