Covid 19: i dati comunicati giornalmente sono utili per capire?

Giorgio Alleva e Alberto Zuliani discutono i limiti dei dati diffusi sull’epidemia, sottolineando come il rito quotidiano della loro comunicazione possa creare confusione. Il mix dei motivi per i quali i tamponi sono effettuati e l’inclusione recente dei test rapidi nel conteggio inficiano la lettura dell’evoluzione del contagio. L’indice Rt viene comunicato come se fosse deterministico. Il numero di decessi da Covid-19 è sottostimato. Manca un disegno organico che fornisca un contesto informativo coerente a sostegno delle decisioni.

*I due autori, fin da marzo 2020, con articoli su riviste, interventi sui media e interviste, sono impegnati a promuovere la progettazione di un sistema informativo multi-fonte su Covid-19, a sostegno della comprensione e delle decisioni.

 

Bastano i dati che vengono forniti ogni giorno attraverso i media per far capire come l’epidemia sta evolvendo? La prima considerazione da fare è che la valutazione non può essere fatta giorno per giorno; ma anche se si facesse per settimana i dati non ci aiuterebbero a trovare risposte soddisfacenti.

Il numero dei contagi accertati è collegato al numero di tamponi ed è influenzato dal mix dei motivi per i quali essi vengono eseguiti: presenza di sintomi; contact-tracing e screening; in qualche caso – non pochi – il motivo non viene registrato (il 15% nell’ultima decade). Purtroppo, non si ha l’informazione sul numero di tamponi rispettivamente eseguiti, cosicché non è possibile calcolare i tassi di positività specifici, verosimilmente differenti fra loro. I test sui contatti dei casi positivi e per screening consentono di far emergere una quota di asintomatici e pauci-sintomatici.

Una valutazione dell’evoluzione dell’intensità del contagio non può dunque basarsi sul numero di nuovi positivi, ma neppure sul tasso di positività (positivi/tamponi) che risente, inoltre, della presenza fra i positivi dei casi di re-testing e anche di quelli emersi da screening. Ambedue andrebbero scorporati sia dal numeratore (test positivi) sia dal denominatore (test eseguiti). Questo consentirebbe una valutazione più veritiera dell’evoluzione del contagio. In ogni caso, il numero di asintomatici e pauci-sintomatici rimane sottovalutato nel numeratore.

Il quadro si è complicato ulteriormente con il conteggio dei test rapidi. Fra il 15 gennaio, data in cui si sono affiancati ai molecolari, e il 19 febbraio 2021, i test rapidi sono stati 3.939.318, quelli molecolari 4.828.347: rispettivamente 44,9% e 55,1%. Il tasso di positività per le due tipologie è molto diverso: 8,13% per i molecolari e 0,92% per i rapidi.

Sembra verosimile che i test rapidi siano rivolti/scelti prevalentemente a/da una platea di asintomatici e pauci-sintomatici e optati per screeening e re-testing. Inoltre, la registrazione dei dati suscita qualche dubbio: fra il 15 gennaio e il 19 febbraio 2021 in Sicilia su 541.294 test rapidi somministrati non è stato segnalato alcun caso positivo (sui tamponi, invece, il tasso di positività è risultato pari a 9,63%, uno dei valori più alti fra tutte le regioni e province autonome nel periodo considerato); in Abruzzo, nello stesso periodo, nessun positivo è stato segnalato su 189.057 test rapidi; così anche in Umbria su 98.238 test e in Liguria su 82.201. Anche in Basilicata, Molise e Val d’Aosta non è stato registrato alcun caso positivo attraverso i test rapidi, e soltanto 6 e 16 in Calabria e in Sardegna rispettivamente.

In conclusione, la numerosità, la tipologia, la composizione per motivo dei test effettuati e la conseguentemente variabile distribuzione per quadro clinico dei positivi rendono problematici i confronti del tasso di positività nel tempo.

Sulla dimensione dei contagi si dispone di un riscontro che proviene dall’indagine sierologica effettuata dal Ministero della salute e dall’Istat fra maggio e luglio 2020. Con le cautele suggerite dalle modalità secondo le quali l’indagine è stata condotta (Alleva G. e Zuliani A., 2020, Coronavirus: chiarezza sui dati, Bancaria, ISSN: 0005-4623, 2020), è stato stimato che, dall’inizio dell’epidemia fino alla conclusione della rilevazione, si erano contagiati 1,48 milioni di persone, un numero sei volte superiore a quello registrato ufficialmente fino a quel momento (Ministero della salute e Istat, 2020, Primi risultati dell’indagine di siero-prevalenza sul SARS-Cov-2, Comunicato stampa 3 agosto 2020).

Possiamo ottenere qualche informazione più soddisfacente dai dati sui ricoveri? Non proprio. I numeri assoluti e il differenziale rispetto al giorno precedente dicono poco. Sarebbe necessario conoscere il dato di stock all’inizio di ogni giornata, il numero di ingressi nel giorno e il numero di uscite per trasferimento, guarigione o decesso, distintamente per i reparti diversi dalla terapia intensiva e per questi ultimi; altrettanto importante sarebbe l’informazione sui tassi di occupazione di pazienti Covid-19 nelle due tipologie di assistenza, le cui soglie di allerta sono fissate al 40% e rispettivamente al 30%. Quest’ultima informazione è rilevante al livello regionale ed è influenzata dal numero di posti letto disponibili.

Rt è l’indicatore che riveste la posizione centrale nel dibattito corrente. C’è grande attenzione sia al livello che assume sia alla qualità dei dati sui quali si fonda il calcolo. Viene presentato dai media come l’elemento di preoccupazione o conforto fondamentale e soprattutto come l’elemento di prova della bontà degli interventi operati nelle settimane precedenti o come indizio per quelli da assumere successivamente.

Un primo aspetto connesso con la qualità della stima dell’indicatore riguarda la capacità del sistema di accertare i contagiati secondo la data di manifestazione del primo sintomo, necessaria per la sua determinazione. Una informazione troppo parziale di questo sotto-insieme, o con parzialità non omogenea nel corso del tempo, può inficiare la stima di Rt e i confronti. In secondo luogo, l’indice è derivato da un modello che sconta semplificazioni significative. Infine, esso viene comunicato come stima puntuale e trattato usualmente come se fosse deterministico, mentre sconta un errore statistico abbastanza ampio (per una chiara esposizione del metodo di calcolo si può vedere: Guzzetta G. e Merler S., 2020, Stime della trasmissibilità di SARS-CoV-2 in Italia). Come è mostrato nella Figura 1, anche il segno positivo o negativo della variazione da una settimana all’altra è spesso statisticamente incerto. Fino al 25 novembre 2020 nel bollettino settimanale dell’Istituto superiore di sanità è stato fornito l’intervallo di credibilità al 95%; dal 2 dicembre viene fornito un range al 95%, molto più ristretto. L’ampiezza dell’intervallo di credibilità è risultata estremamente variabile nel tempo. A settembre 2020 è stata pari in media a 0,428 punti (minimo: 0,17; massimo: 0,82); a ottobre a 0,42 (minimo: 0,19; massimo: 0,66); a novembre a 0,50 (minimo: 0,34; massimo: 0,73); successivamente, l’ampiezza del range è risultata pari in media a 0,149 (minimo: 0,09; massimo: 0,26). Gli intervalli riferiti alle regioni sono più ampi in quanto basati su un numero inferiore di casi.

Il numero dei morti per Covid-19 è un dato di per sé angosciante, soprattutto quando non accenna a diminuire al passare dei giorni. Per poterne valutare l’evoluzione si ricorre al tasso di letalità (morti per Covid-19 per 100 contagiati) e a quello di mortalità (morti per Covid-19 per 100.000 abitanti), con i limiti dovuti al fatto che, per il primo tasso, si dispone dei soli contagiati accertati, con una presenza assoluta e relativa di asintomatici e pauci-sintomatici variabile nel tempo e territorialmente e che, per ambedue, il numero di morti per Covid-19 è sottostimato. Con questi limiti nella figura 2 è proposto un confronto fra prima ondata (marzo-maggio 2020) e seconda ondata (ottobre 2020 e tuttora in corso) dell’epidemia al livello regionale.

La seconda ondata sta producendo un numero di morti giornaliero per milione di abitanti più elevato rispetto a quello della prima ondata: 7,2 rispetto a 5,8 per l’Italia nel complesso. Per ambedue i periodi, l’intensità di decessi prevale nelle regioni del Nord. Durante la prima ondata Lombardia e Valle d’Aosta presentavano le incidenze più elevate, seguite da Liguria, Emilia Romagna, Piemonte e Provincia autonoma di Trento. Nelle regioni centrali e nel Mezzogiorno il tasso era molto inferiore. Durante la seconda ondata al primo posto si trova la Val d’Aosta seguita da Friuli Venezia Giulia, Veneto, Provincia autonoma di Trento, Liguria, Emilia Romagna, provincia autonoma di Bolzano, Piemonte e Lombardia. Tutte le altre regioni presentano tassi minori e sempre inferiori a quello medio italiano.

La mortalità per Covid-19 è sottostimata. Si capisce dal confronto fra il numero di morti per tutte le cause da febbraio a novembre 2020 (periodo per il quale sono disponibili dati; Istat e Istituto superiore di sanità, 2020, Impatto dell’epidemia Covid-19 sulla mortalità totale della popolazione residente. Periodo gennaio-novembre 2020) e quello medio nel medesimo intervallo di tempo fra il 2015 e il 2019. L’eccesso di mortalità rispetto a quella usuale nel periodo (figura 3) si concentra nei mesi di marzo-maggio 2020 (prima ondata) e riprende da fine settembre 2020 proseguendo fino a fine novembre (data dalla quale i dati non sono più disponibili) e prevedibilmente dura tuttora. 

L’eccesso di mortalità nella prima ondata è pressoché uguale in percentuale a quello nella seconda (rispettivamente 23,8% e 23,5%); anche la quota di morti registrati ‘da Covid’ e quella complementare di morti registrati per altre cause rimangono stabili: rispettivamente 2/3 e 1/3. Per gli over 80 la quota di morti ‘da Covid’ aumenta da 52% a 55% e corrispondentemente diminuisce da 48% a 45% quella per altre cause (tabella 1). Durante la prima ondata l’eccesso non registrato come Covid è stato considerato generalmente ‘Covid sommerso’; nella seconda ondata, il miglioramento della capacità diagnostica intervenuto nel frattempo potrebbe ridimensionare questa interpretazione. Tuttavia, l’eccesso di mortalità, si tratti di casi Covid-19 non diagnosticati come tali e attribuiti a patologie concomitanti o di pazienti morti per non aver ricevuto le cure necessarie per patologie preesistenti o dal sistema ospedaliero, pressato dall’emergenza, o dalla medicina territoriale, sostanzialmente assente, non può che esser ricondotto all’epidemia. Per le considerazioni precedenti, il tasso di mortalità (morti per Covid-19 per 100.000 abitanti) è sottostimato.

In conclusione, con i dati resi disponibili non è facile capire a che punto siamo. I confronti sono problematici e i collegamenti ardui, poiché manca un quadro di coerenza. Avvertiamo disagio anzitutto come cittadini e anche come statistici. Come cittadini vorremmo più trasparenza; vorremmo poter aumentare la nostra fiducia nelle istituzioni, alimentati da una comunicazione realmente informativa. Come statistici vorremmo poter contribuire a ridurre l’incertezza, in parte ineludibile su un’epidemia subdola e mutevole come questa da SARS-CoV-2, che si è diffusa rapidamente e ha colpito con un’intensità inattesa. Si può fare molto meglio.

Tabella 1 – Eccesso di mortalità nei periodi marzo-maggio (prima ondata) e ottobre-novembre 2020 (seconda ondataa) rispetto alla media per gli stessi periodi negli anni 2015-2019 e confronto con il numero di morti registrati per Covid-19

 Descrizione

Dati registrati

Stime (%)

Decessi nel 2020

Eccesso sulla media 2015-2019

Morti in eccesso registrati per Covid-19

Morti in eccesso registrati per altre cause

Prima ondata

Tutte le età

211.047

50.254 (23,5%)

68%

32%

80 anni e più

138.307

36.424

52%

48%

Seconda ondata

Tutte le età

134.767

31.715  (23,8%)

67%

33%

80 anni e più

88.425

23.428

55%

45%

a La seconda ondata dura tuttora.

Fonte: Elaborazione su dati dell’Istituto superiore di sanità e dell’Istat.

Figura 1 – Stima dell’indice Rt medio a 14 giorni e numero di casi per data di prelievo/diagnosi distinti per presenza o assenza della data di inizio dei sintomi

Fonte: Istituto superiore di sanità, Bollettino del 13 febbraio 2021.

Figura 2 – Tasso di mortalità giornaliero per Covid-19 per milione di abitanti nel periodo 21 febbraio – 31 maggio 2020 (prima ondata) e 1° ottobre 2020 – 31 gennaio 2021 (seconda ondataa) nelle regioni italiane

a La seconda ondata dura tuttora.

Fonte: Elaborazione su dati Istat

Figura 3 – Eccesso di mortalità generale per settimana dal 1° gennaio al 30 novembre 2020 rispetto alla media per la settimana corrispondente negli anni 2015-2019

 

Fonte: Elaborazione su dati Istat

Fonte: Istituto superiore di sanità, Bollettino del 13 febbraio 2021.

Schede e storico autori