Come calcolare i valori predittivi nei test diagnostici

Qual è la probabilità di essere ammalati di una specifica malattia avendo un determinato sintomo? Per rispondere a questa domanda abbiamo necessità di calcolare i valori predittivi dei test diagnostici.

I test diagnostici si classificano in due grandi ambiti: test di screening o test di conferma. I primi sono test molto sensibili e poco specifici in quanto hanno come obiettivo quello di identificare possibili pazienti a rischio malattia. Al contrario, i test di conferma sono molto specifici e poco sensibili: il loro obiettivo è discriminare tra falsi positivi e veri positivi.

La sensibilità e la specificità di un test sono misure riferite allo specifico test diagnostico, ma non sono misure di per sé sufficienti per prevedere le probabilità riferite al singolo paziente di essere sano o malato. In particolare, conoscere solo quanto un test è sensibile o specifico non ci permette di rispondere alle due seguenti domande:

  • Se un paziente risulta positivo al test, qual è la probabilità che esso sia realmente malato?
  • Se un paziente risulta negativo al test, qual è la probabilità che esso sia realmente sano?

Per rispondere a queste domande bisogna introdurre due nuove misure: i valori predittivi. Essi specificatamente si identificano come Valore Predittivo Positivo (VPP) e Valore Predittivo Negativo (VPN).

Valore Predittivo Positivo

Il Valore Predittivo Positivo (VPP) serve per identificare la probabilità di essere malato dopo essere stato trovato positivo ad un test diagnostico. In formule questa probabilità è data dalla seguente uguaglianza:

\[VPP =P(m\diagup +) = \frac{VP}{VP+FP}\]

Dunque, la probabilità di essere ammalato dopo aver ricevuto un test positivo è data dal rapporto tra il numero dei Veri Positivi diviso per la somma di Veri Positivi e Falsi Positivi.

È evidente che il Valore Predittivo Positivo è fortemente influenzato dalla specificità del test diagnostico: più il test è in grado di identificare i malati (cioè è specifico), minore sarà l’errore α (alfa) e quindi maggiore sarà il valore predittivo negativo.

Valore Predittivo Negativo

Il Valore Predittivo Negativo (VPN) serve per per identificare la probabilità di essere sano dopo essere stato trovato negativo ad un test diagnostico. In formule questa probabilità è data dalla seguente uguaglianza:

\[VPN =P(s\diagup -) = \frac{VN}{VN+FN}\]

Dunque, la probabilità di essere sano dopo aver ricevuto un test negativo è data dal rapporto tra il numero dei Veri Negativi diviso per la somma di Veri Negativi e Falsi Negativi.

È evidente che il Valore Predittivo Negativo è fortemente influenzato dalla sensibilità del test diagnostico: più il test è in grado di discriminare tra sani e malati (cioè è sensibile), minore sarà l’errore β (beta) e quindi maggiore sarà il valore predittivo negativo.

Test diagnostici: le differenze in ordine di VPN e VPP

Da tutto quanto detto emerge che i test di screening, il cui obiettivo è quello di identificare le persone a rischio malattia, riporteranno il Valore Predittivo Negativo (VPN) più alto. I test di conferma, il cui scopo è di discriminare tra malati e falsi positivi, avranno il valore predittivo positivo (VPP) più alto.


VPP e VPN con Bayes

I valori predittivi si possono determinare utilizzando il teorema di Bayes. Indichiamo con M e D rispettivamente la presenza della malattia e la presenza del disturbo. Il teorema di Bayes consente di prevedere la probabilità che un soggetto sia ammalato vista la presenza di un particolare disturbo.

Breve richiamo al teorema di Bayes

Applicando il teorema di Bayes, in formule si ha che:

\[P(M\diagup D)=\frac{P(D \diagup M)\cdot P(M)}{P(D)}\]

Questa formula afferma che la probabilità che un soggetto che soffre di un determinato disturbo (D) sia effettivamente ammalato (M) è pari al prodotto tra la probabilità che il soggetto soffra di un determinato disturbo (D) data la presenza di una determinata malattia (M) e la probabilità di essere ammalati P(M), diviso per la probabilità di avere uno specifico disturbo P(D).

Per rendere più chiara la formulazione del teorema di Bayes ti faccio un esempio. Si immagini di voler determinare la probabilità di un paziente di essere affetto di tumore al polmone data la presenza di una forte tosse. Applicando il teorema di Bayes questa probabilità è data dalla seguente formula:

\[P(\text {cancro al polmone}\diagup \text{tosse})=\frac{P(\text{tosse}\diagup \text{cancro al polmone})\cdot P(\text{cancro al polmone})}{P(\text{tosse})}\]

Dunque ne deriva che per poter determinare se il paziente è ammalato presentando quale sintomo la tosse, è necessario conoscere tre aspetti importanti:

  1. la probabilità che la tosse sia presente nei pazienti già affetti da cancro al polmone, dato desumibile dall’osservazione dei pazienti malati;
  2. la probabilità di cancro al polmone nella popolazione a cui appartiene il paziente, dato ampiamente conosciuto in termini nazionali e mondiali;
  3. la probabilità di tosse nella popolazione a cui appartiene il paziente, dato conosciuto in base alle stime epidemiologiche.

Valore predittivo positivo e Valore predittivo negativo

Alla luce di quanto appena visto sul teorema di Bayes è possibile dunque ricavare i due valori predittivi applicando proprio il predetto teorema. In particolare si ha:

\[VPP = P(m \diagup +) = \frac{P(+ \diagup m)\cdot P(m)}{P(+ \diagup m)\cdot P(m)+ P(+ \diagup s)\cdot P(s)}=\frac{\text {sensibilità}}{\text {sensibilità}+\frac{\alpha}{OP}}\] \[VPN = P(s \diagup -) = \frac{P(- \diagup s)\cdot P(s)}{P(- \diagup s)\cdot P(s)+ P(- \diagup m)\cdot P(m)}=\frac{\text {specificità}}{\text {specificità}+\beta\cdot OP}\]

Semplificando ancora si ha che:

\[VPP = \frac{1-\beta}{(1-\beta)+\frac{\alpha}{OP}}\] \[VPN = \frac{1-\alpha}{(1-\alpha)+\beta\cdot OP}\]

Resta un’ultima domanda: chi è OP? Esso è:

\[OP = \frac{P(m)}{P(s)}\]
Previous Article

La statistica al tempo del COVID-19

Next Article

Come determinare la significatività della correlazione di Pearson

Related Posts