Un aggiornamento sulla mortalità del COVID19

L’utente @tonini_stef di Twitter (Stefano Tonini), che ringrazio, mi ha segnalato l’uscita del rapporto ISTAT sulla mortalità nel primo trimestre del 2020. Il rapporto si basa sui dati provenienti dagli uffici anagrafe di molti piú comuni rispetto a quelli usati dal SiSMG ed è pertanto piu attendibile.

Il rapporto rivela che il 91% dell’eccesso di mortalità si concentra nei comuni ad alta diffusione dell’epidemia, nei quali si è passati dai 26218 morti attesi a 49351, con un incremento di 23133 unità. Nelle aree a media diffusione si passa da una mortalità attesa di 17317 a 19743 morti, con un incremento di 2426. Nei comuni a bassa diffusione della malattia il numero dei morti complessivi è diminuito dell’1.8%, segno che in queste zone gli effetti del COVID-19 non sono statisticamente significativi. Si passa, infatti, da 22057 decessi attesi a 21852 effettivi. Tutti questi numeri hanno un’incertezza che si può stimare come la radice del numero stesso, perché seguono la statistica di Poisson. L’incertezza della differenza tra due numeri invece si ottiene sommando i numeri ed estraendo la radice del risultato. Per esempio, il numero totale di decessi attesi è di 65592 \pm\sqrt{65592}=65592\pm 260, quello degli effettivi 90946\pm 300 e la differenza è 25354\pm 400.

Nella tabella che segue riportiamo sinteticamente i dati relativi a decessi attesi, decessi effettivi, differenza tra questi e relative incertezze per le tre aree (approssimate, come d’uso, a due sole cifre significative).

Regioneattesaeffettivodifferenza
Alta diffusione26218±16049351±22023133±270
Media diffusione17317±13019743±1402426±190
Bassa diffusione22057±15021852±150-205±210
Totale65592±26090946±30025354±400

Dalla tabella si vede bene che il numero delle aree a bassa diffusione del virus è compatibile con zero (in sostanza il virus non ha modificato la mortalità di quella regione).

Dai dati del SiSMG del precedente post sull’argomento, meno precisi e i cui numeri si ricava esclusivamente dal grafico pubblicato, si evince che in media ci si attendono, nel periodo considerato, circa 23390 decessi nelle regioni del Nord Italia che grosso modo coincidono con quelle in cui virus è piú diffuso. Questo numero si ottiene sommando i valori medi di mortalità giornaliera (tra 120 e 130) per gli ultimi sei punti (il periodo considerato nel rapporto ISTAT), moltiplicando questi numeri per 7 (perché i sei punti corrispondono ad altrettante settimane) e per il rapporto 27.7/6.3 per scalare su tutta la popolazione del Nord (il rapporto SiSMG considera solo una frazione della popolazione corrispondente a 6.3 milioni di abitanti, contro i 27.7 di tutto il Nord). Allo stesso modo si ricavano i decessi effettivi che risultano essere 31390, con una differenza di 8000.

La differenza tra i valori estrapolati dal SiSMG e quelli del rapporto ISTAT è significativa, ma occorre considerare che le aree considerate non sono omogenee. Nel caso del SiSMG i dati si riferiscono a tutte le province del Nord, mentre il rapporto ISTAT definisce le regioni sulla base della diffusione dell’infezione. Nei comuni del Nord ci sono sia aree ad alta diffusione che a bassa diffusione. Per confrontare i dati possiamo considerare la media dei comuni ad alta e bassa diffusione per cui ci si attendono 21768±140 decessi e se ne osservano 34547±150, numeri molto piú vicini a quelli che si evincono dai dati SiSMG.

Questa analisi conferma quelle stime, ma con un’importante osservazione. Se mediamente possiamo attenderci una mortalità in linea con quanto dichiarato ogni sera dalla protezione civile, tale mortalità non è affatto omogenea nelle diverse aree del Paese e pertanto la mortalità effettiva può essere parecchio piú alta. In particolare il rapporto ISTAT segnala che nelle aree ad alta diffusione la discrepanza tra i decessi osservati e quelli ascritti al COVID-19 è pari circa al 100%, nel senso che i decessi con diagnosi COVID-19 sono il 52% dei decessi osservati in piú rispetto alle attese, il che indica una mortalità doppia rispetto alla media.

In particolare, se l’eccesso di mortalità nelle aree ad alta densità e stato dell’88% ((49351-26218)/26218), nella provincia di Bergamo è stato ben del 568% (!). Si è passati dai 1180 decessi attesi a 6328. I decessi dichiarati COVID sono stati 2346. Sembra dunque che, in questo caso, tali decessi siano sottostimati di un fattore 2.2 circa e questo sembra essere dunque il limite superiore dell’incertezza con la quale si conosce questo numero.

In altre parole il numero di decessi attribuibili al COVID-19 sembra essere al massimo un fattore 2 sopra quello comunicato dalla protezione civile, ma di certo non su tutto il territorio nazionale, ma soltanto in certe aree particolarmente colpite del Paese il che tende a far pensare che molte di esse siano morti indirette, causate cioè dallo stress cui sono stati sottoposti gli ospedali che non hanno avuto la capacità di curare efficacemente i pazienti. I dati, in sostanza, sembrano confermare che essere preparati ad affrontare l’epidemia con ospedali ben organizzati sia la chiave per ridurre il prezzo pagato in vite umane a livelli tutto sommato fisiologici.

Un piano scientifico

Il Presidente del Consiglio Giuseppe Conte, in risposta alle polemiche sollevate dalla pubblicazione delle regole sulla cosiddetta “fase 2”, in Aula dice: “Non ci sarà un piano rimesso a iniziative improvvide di singoli enti locali, ma basato su rilevazioni scientifiche”.

Peccato che al momento le norme non sembrino affatto dettate da considerazioni scientifiche, quanto da questioni di opportunità politica o di carattere “morale”, almeno a mio modo di vedere. Vediamo perché.

Le attuali norme per il contenimento dell’infezione da SARS-Cov-2, il virus che provoca il COVID-19, dispongono che certe attività, appartenenti a certi settori economico-produttivi (i cosiddetti codici ATECO) possano riaprire (e.g. “confezione di articoli per abbigliamento”) mentre altre (i ristoranti) non possono farlo. Solo certe manifestazioni, come i funerali, sono consentite, a certe condizioni. Si possono vedere i “congiunti”, ma non è consentito cenare con un’amica o un amico. Ci si può spostare solo all’interno della regione di domicilio. Le norme sono le stesse su tutto il territorio nazionale.

Dal punto di vista scientifico la diffusione dell’infezione si contrasta limitando i contatti tra le persone e prevedendo l’uso di dispositivi che ne limitano la diffusione, come i guanti e le mascherine. Al virus non importa nulla se le persone si vedono perché stabilmente legate da affetti pregressi o per porgere l’estremo saluto a un “congiunto”, oppure ancora se si è al lavoro per il confezionamento degli abiti o di cibo. Provvedimenti dettati da criteri scientifici, dunque, avrebbero dovuto prendere in considerazione parametri del tutto diversi.

Per esempio, si potrebbe consentire l’apertura di attività la cui superficie per unità di personale è maggiore di una determinata soglia. In questo modo il laboratorio di confezionamento di camicie installato in un’ex rimessa nella quale lavorano tre persone sarebbe chiuso, mentre un ristorante molto ampio, con pochi tavoli, potrebbe riaprire.

Si potrebbero consentire convegni di persone stabilendo il numero massimo per unità di superficie, indipendentemente dalla loro natura. Tutte le cerimonie funebri, ma anche le messe, la preghiera del venerdí dei musulmani, la riunione del circolo letterario, etc., si potrebbero svolgere se i locali sono idonei e sarebbero vietati se non lo fossero (ci sono migliaia di chiese, in Italia, in cui entrano a malapena 15 persone; al contrario ho visto film al cinema in sale con tre o quattro persone).

Naturalmente tutte queste attività dovrebbero essere soggette a sanzioni qualora le norme non venissero rispettate.

Bisognerebbe anche prevedere meccanismi di aggiornamento del tutto assenti nelle attuali norme. Occorrerebbe un controllo capillare e costante del numero di infetti, degli accessi in ospedale e dei morti per stabilire se e quando sia necessario tornare a limitare le attività e gli spostamenti consentiti. Questo numero evidentemente varia da località a località ed è pertanto opportuno differenziare le misure secondo l’area geografica (cosa che non si vuole evidentemente fare, ma che sarebbe la piú sensata).

In definitiva non mi pare di scorgere criteri scientifici nel dettato delle nuove norme di contrasto al COVID-19. Il timore è che l’evidente poca razionalità della norma porti a comportamenti altrettanto irrazionali, vanificando cosí il giusto sacrificio fatto finora con grande responsabilità dalla stragrande maggioranza degli italiani.

Quanti sono i morti per COVID19?

I dati forniti dalla protezione civile relativi ai morti per COVID19, come si sa, sono affetti da grosse incertezze sistematiche dovute al campionamento molto parziale e ad ambiguità delle definizioni. Possiamo però provare a stimare questi errori incrociando dati diversi.

Il Sistema di Sorveglianza della Mortalità Giornaliera (SiSMG) è un consorzio che raccoglie quotidianamente i dati provenienti dagli uffici anagrafe di diversi comuni. È nato diversi anni fa per stimare gli effetti del caldo eccessivo e quelli dell’influenza stagionale sulla mortalità, specialmente tra le persone anziane. Il SiSMG pubblica un bollettino settimanale che ho consultato per ottenere i dati usati in questo post (all’indirizzo http://www.deplazio.net/images/stories/SISMG/SISMG_COVID19.pdf si trova il documento).

Dal grafico n. 1A del documento, sotto riprodotto, si evince che la mortalità giornaliera ordinaria delle città del Nord Italia considerate (Aosta, Bolzano, Trento, Trieste, Torino, Milano, Brescia, Verona, Venezia, Bologna e Genova) è passata da circa 120 morti/d medi a 280 morti/d in media nella settimana compresa tra il 25 e il 31 marzo scorsi.

L’eccesso è di 160 morti/d corrispondenti a 1100 a settimana.

In queste città vivono in totale 6.3 milioni di persone. Gli abitanti di tutto il Nord Italia sono invece 27.7 milioni (dati ottenuti da Google e/o Wikipedia). Se scaliamo i dati della mortalità ordinaria provenienti dal SiSMG per il rapporto tra questi due numeri si trova che ci si attenderebbero 120*27.7/6.3=528 morti al giorno in tutto il Nord Italia. Dai dati ISTAT si evince che i morti nel Nord Italia lo scorso anno sono stati 141000, corrispondenti a circa 390 morti al giorno in media. Questo numero non sembra coerente con i 528 stimati sopra, ma occorre considerare che nel corso dell’anno ci sono variazioni significative. In questo periodo la mortalità è grosso modo il 20-30% superiore rispetto alla media (vedi grafico sotto), il che significa ci dobbiamo attendere attorno ai 500 morti al giorno, non distante dalle attese.

Nel periodo in cui imperversa il COVID19 (nella settimana considerata) i morti registrati dal SiSMG sono 160 in più al giorno, che si traducono in 160*27.7/6.3=703 morti in più al giorno in tutto il Nord Italia. In sintesi, per effetto del COVID19 nel Nord Italia sembrano esserci circa 700 morti in più al giorno (per effetto del COVID19 significa che questo eccesso di morti si può imputare sia agli effetti diretti che a quelli indiretti della malattia: se per esempio non ci si reca in ospedale per paura e si muore, si viene contati tra i morti per COVID19, anche se non si era infetti).

Dai dati forniti dalla protezione civile risultano 11011 morti al 31 marzo e 6161 al 24 dello stesso mese, il che significa che nella settimana in questione sono stati contati 4850 morti ufficiali, cioè 693 in media al giorno. Questo numero non sembra molto diverso da quello stimato dai dati del SiSMG, quindi sembrerebbe attendibile. Questo, naturalmente, non significa che la stima degli infetti sia corretta, ma che, se non ho commesso errori (il che è sempre possibile) almeno quella dei morti non sia del tutto campata in aria.

La crescita dei morti per COVID19

Quando ho iniziato a guardare i dati del COVID19 ho notato subito che il rapporto morti/infetti tendeva ad aumentare col tempo. Inizialmente ho attribuito questo comportamento alla mutevole capacità di diagnosi, poi, quando il trend si è manifestato in modo evidente, ho pensato che si trattasse di un sintomo di stress delle strutture sanitarie che non riuscivano a trattare adeguatamente in pazienti.

Un’analisi piú attenta, però, mostra che in realtà questo è proprio l’andamento atteso. Vediamo perché.

Indichiamo con f(t) la funzione che rappresenta l’evoluzione temporale degli infetti N_{inf}(t) = f(t). I morti per COVID19 saranno, mediamente, una frazione di N_{inf}, quindi potremmo scrivere N_{morti} = \alpha N_{inf} con \alpha < 1 grosso modo costante. Non possiamo però scrivere che N_{morti} = \alpha f(t) perché si comincia a morire trascorsi alcuni giorni dal momento in cui si contrae l’infezione. Quindi avremo che

N_{morti} = \alpha f\left(t-t_0\right)

pertanto il rapporto morti/infetti si scrive

\frac{N_{morti}}{N_{inf}} = \alpha \frac{f\left(t-t_0\right)}{f(t)}

Non conosciamo la funzione f(t) (anche se dagli ultimi dati disponibili sembra ben rappresentata da una funzione di Gompertz). Possiamo però fare considerazioni del tutto generali.

Di una funzione possiamo disegnarne il grafico riportando su un sistema di assi cartesiani i valori della funzione f(t) in funzione della variabile da cui dipende t. Per esempio, se f(t)=\sqrt{t}, possiamo calcolare i valori di f(0),\,f(1),\,f(2)\,f(3),\ldots e riportarli su un grafico in funzione di t=0,\,1,\,2,\,3,\ldots. Questi valori sono 0,\,1,\,1.41,\,1.73,\ldots e il grafico appare cosí

Ogni funzione con caratteristiche molto generali come quelle che ci interessano si può approssimare, in un intervallo relativamente ristretto di valori, con un polinomio p(t) di grado opportuno, cioè f(t)\simeq p(t). Minore è l’ampiezza dell’intervallo e migliore è l’approssimazione, cosí come maggiore è il grado del polinomio, a parità di ampiezza dell’intervallo, migliore è l’approssimazione. In sostanza possiamo sempre scrivere che

f(t)\simeq f(t_0)+f'(t_0)(t-t_0)+\frac{f''(t_0)}{2}(t-t_0)^2+\cdots

dove f'(t_0) e f''(t_0) sono quelle che i matematici chiamano derivate della funzione. La derivata f'(t) di una funzione si può immaginare come la pendenza della retta tangente alla sua rappresentazione grafica nel punto indicato tra parentesi. La derivata seconda f''(t) è, a sua volta, la pendenza della tangente alla curva che rappresenta f'(t) e cosí via. Nella figura sotto riportiamo la curva f(t)=\sqrt{t} insieme ai primi tre polinomi che l’approssimano per t=1.

Il primo è rappresentato dalla retta viola, che è una costante che vale 1. L’approssimazione è buona solo per valori vicini a t=1. La retta verde è il polinomio di grado 1 che approssima bene al curva in un intervallo piú ampio, ma che già per t=2 comincia a distinguersi bene dalla curva originale. Il polinomio di grado 2 (la curva azzurra) rappresenta meglio la curva originale (fino a circa t=3 con la precisione che raggiunge il polinomio di grado 1 per t=2).

Tornando alla nostra f(t) possiamo sempre scrivere quindi che

f(t) \simeq f(t_0)+f'(t_0)(t-t_0)+\frac{f''(t_0)}{2}(t-t_0)^2

La curva dei morti, quindi, si rappresenta sostituendo al posto di t, t-t_0 nei coefficienti del polinomio. Abbiamo quindi

f(t-t_0) \simeq f(t_0-t_0)+f'(t_0-t_0)(t-t_0)+\frac{f''(t_0-t_0)}{2}(t-t_0)^2= f(0)+f'(0)(t-t_0)+\frac{f''(0)}{2}(t-t_0)^2

Poiché all’inizio il numero d’infetti è zero, prendendo per t=0 l’inizio dell’epidemia f(0)=0. Inoltre, la salita degli infetti inizia in maniera dolce, quasi piatta, e la retta tangente alla curva che rappresenta f(t) è quasi orizzontale per cui anche f'(0)\simeq 0 e di conseguenza

\frac{N_{morti}}{N_{inf}}=\frac{\alpha f(t-t_0)}{f(t)}\simeq \alpha\frac{f''(0)}{2}(t-t_0)^2\frac{2}{f''(0)t^2} = \alpha\left(\frac{t-t_0}{t}\right)^2

Questa curva, per \alpha = 1 e t_0=5 è fatta cosí

La curva rappresenta la frazione dei morti in funzione del tempo solo per t>t_0 (nel caso dell’immagine per t>5) e si vede bene che in effetti cresce come sembra crescere tale rapporto nella realtà. Per tempi molto lunghi la curva tende asintoticamente ad \alpha (si avvicina cioè sempre piú a questo valore).

Usando tecniche di minimizzazione possiamo trovare i valori da attribuire ai parametri \alpha e t_0 per descrivere i dati sperimentali del rapporto morti/infetti. Riportiamo sotto il grafico che se ne ottiene.

La banda rosa rappresenta la porzione di dati utilizzati per eseguire il calcolo che fornisce \alpha = 0.126 \pm 0.013 e t_0=5.8 \pm 2.8. Il secondo valore ci dice con quanti giorni di ritardo, in media, si muore, dopo aver contratto l’infezione. Il numero è compatibile con t_0\simeq 5 che forniscono i medici.

La mortalità asintotica \alpha di quasi il 13% ci dice che il virus è letale nel 13% dei casi. Ma attenzione. Questo numero dipende fortemente da quanto bravi siamo a individuare gli infetti. Ci sono evidenze che i morti siano decisamente sottostimati. Figuriamoci gli infetti.

Personalmente tendo a credere di piú ai dati raccolti a bordo della Diamond Princess, tutti i passeggeri della quale sono stati sottoposti a tampone. Di questi 712 sono stati trovati positivi e solo 10 sono morti. La mortalità del virus quindi dev’essere dell’ordine dell’1.4% (10/712). Il fatto che la mortalità italiana appaia dieci volte superiore presumibilmente significa che gli infetti sono sottostimati almeno dello stesso fattore. Un fattore 10 di differenza tra gli infetti reali e quelli ufficiali, in effetti, è un numero che comincia a circolare e sembra sempre piú realistico. Se cosí fosse, per ogni malato ufficiale ce ne sarebbero una decina che non sanno di esserlo e sono quindi veicolo di contagio. Questa è una buona ragione per mantenere il lockdown, che tuttavia occorrerà prima o poi quanto meno allentare perché la situazione economica sta diventando insostenibile per molti. Da questo punto di vista il tracciamento dei contatti di chi si scopre infetto sarà uno strumento utilissimo.

Per finire osservo che il fatto che il rapporto sia affetto da errori sistematici notevoli si vede anche dal fatto che in corrispondenza della fine dell’intervallo di fit si vede un “salto” del rapporto, che non dovrebbe esserci in condizioni normali. È utile sapere che l’intervallo non è stato scelto ad hoc. Per determinarlo ho trovato il punto in cui il rapporto N_{morti}/N_{inf} si è ridotto della metà partendo da destra e poi definendo un intervallo di 24 giorni che inizia una settimana prima di questo punto, in modo da essere vicini al punto di flesso della curva che è quello in cui ho fatto l’approssimazione.

Consistency is more important

All’inizio della mia carriera scientifica ho avuto la fortuna di lavorare nell’esperimento L3 a LEP diretto dal Premio Nobel Samuel C.C. Ting, dal quale credo d’aver imparato molte cose importanti. Una delle cose che Ting usava dire, che resta sempre scolpita nella mia mente, era “consistency is more important than truth“.

Cito questa frase a proposito delle discussioni che imperversano sulla rete relative all’affidabilità dei numeri forniti dalla protezione civile, riguardanti la diffusione del COVID19. Da piú parti s’invoca un cambio di strategia sui criteri per fare i tamponi ai fini di una maggior affidabilità dei dati epidemiologici.

Se c’è una cosa che so è che non sono un epidemiologo e quindi non ho alcuna intenzione di interpretare i numeri come tale. Può darsi che per un epidemiologo questo sia importante. Non lo so.

Per un fisico, almeno entro certi limiti, lo è poco. Dal mio punto di vista i dati che provengono dalla protezione civile sono a tutti gli effetti paragonabili ai dati che si raccolgono a un esperimento nel quale si misura una grandezza fisica di cui non si conosce nulla. Un esempio concreto di questa situazione è la ricerca sulla materia oscura. Sappiamo che c’è, ma non sappiamo molto piú di questo. Allora cominciamo a fare misure per determinarne la densità e la distribuzione per cercare di capirci qualcosa, anche se è possibile che le nostre misure siano affette da errori sistematici dovuti, per esempio, all’incapacità di rilevare certi effetti o alla scarsa sensibilità dei nostri strumenti o ancora alla non conoscenza di fenomeni ancora da scoprire. È del tutto ovvio che la nostra conoscenza della materia oscura sarà del tutto parziale, ma se non cominciamo a “mapparla” non ne sapremo mai nulla.

Lo stesso sta avvenendo per quanto riguarda la diffusione del COVID19. Di questa malattia sappiamo molto poco. È la prima volta che abbiamo a che fare con questo virus quindi non possiamo sapere come si comporta. La conoscenza si acquisisce man mano che se ne studiano gli effetti. Tutti ricorderanno, per esempio, che la prima misura adottata fu quella di isolare i malati con sintomi. Nessuno, infatti, poteva prevedere che la malattia potesse essere trasmessa anche dagli asintomatici. S’impara dall’esperienza. Quindi l’unica cosa che possiamo fare è osservare i dati e cercare di capire se questi ci dicono qualcosa.

I dati della protezione civile finora ci hanno detto che il numero di malati, apparentemente, fluttua moltissimo di giorno in giorno. Tali fluttuazioni non sono certamente ascrivibili alla natura statistica della misura. Ci sono certamente importanti effetti sistematici (alcune volte mancano i dati di qualche regione o provincia, altre volte a questi dati si sommano quelli dei giorni precedenti a causa di ritardi, etc.). Questo genere di fenomeni si tiene sotto controllo aggregando i dati su piú giorni: cosa che ho iniziato a fare da un po’.

I dati (per esempio quelli sulla mortalità) ci dicono che molto probabilmente il numero di infetti è fortemente sottostimato. C’è chi dice persino di un fattore 10. Confrontando la mortalità osservata in zone piú sotto controllo, dove la mortalità appare oscillare tra l’1% e il 3%, a me sembra ragionevole affermare che noi stiamo tracciando tra un terzo e un decimo della popolazione effettivamente infettata dal virus. È evidente che la gran parte della popolazione dev’essere asintomatica, altrimenti l’avremmo individuata come malata.

Ma c’importa davvero sapere quanti sono gli infetti? Dipende. Dipende da quel che vogliamo fare. Se vogliamo capire come funziona la trasmissione del virus, quali effetti provoca e in che misura, naturalmente sí. Questa però non è materia per fisici, quindi personalmente non me ne curo.

Io tengo sotto controllo la diffusione dell’infezione dal punto di vista degli effetti sulle persone e cerco di capire se le strategie di contenimento stanno funzionando e in che misura. Cerco anche di predire, per quanto possibile, l’evoluzione dell’epidemia. Per far questo non ho bisogno di avere l’informazione completa. Anche conoscendo una frazione dei reali infetti possono seguire la malattia, purché tale frazione si mantenga costante nei limiti delle fluttuazioni statistiche che ovviamente possono verificarsi quando si analizza un campione dell’intera popolazione.

Un’eventuale cambio di strategia, da questo punto di vista, sarebbe fatale. Un significativo aumento dei tamponi, per esempio, modificherebbe la struttura del campione e i dati dei giorni precedenti non si potrebbero confrontare con quelli nuovi.

Che il dato fornito dalla protezione civile, benché parziale, sia significativo, ce lo dice il fatto che i grafici che rappresentano l’evoluzione della malattia appaiono ragionevolmente compatibili tra loro di giorno in giorno. Nel grafico sotto, per esempio, dove i dati non sono neanche aggregati su piú giorni, non ci sono salti evidenti e i punti sperimentali si distribuiscono lungo una curva in modo ragionevolmente continuo.

Ovviamente i dati che appaiono piú stabili sono quelli la cui statistica è maggiore, anche se affetti da errori sistematici piú grandi, come nel caso degli infetti, oppure quelli per i quali la statistica è piú bassa, ma sono meno soggetti a interpretazioni (come i morti). Categorie come “ospedalizzati”, “in isolamento”, “guariti”, ad esempio, sono soggette a valutazione da parte dei medici e questo introduce dei bias che possono far fluttuare molto i dati di giorno in giorno.

Dall’analisi che faccio quotidianamente per predire il picco si evince che la data in cui questo sarà raggiunto si è spostata sempre piú in là col passare del tempo. Questo è del tutto ragionevole perché la crescita dei casi rallenta man mano che si assumono misure di contenimento via via piú efficaci. L’incapacità di predire con largo anticipo si può leggere come una buona notizia: le misure di contenimento tendono a spostare il picco a destra (ovviamente, abbassandolo).

Ecco perché fino a che i dati che utilizzo non presenteranno evidenti patologie continuerò ad usarli per le mie analisi, incurante del fatto che siano affetti da (anche grossolani) errori di valutazione: consistency is more important than truth.

Anche il modello adottato per descriverli dev’essere mantenuto costante, almeno fino a quando non sarà dimostrato essere inadeguato. Sono praticamente certo che nessuno dei modelli matematici piú in uso sia corretto. Tutti i modelli, infatti, partono da assunzioni molto semplici che chiaramente non rispecchiano la realtà. Rappresentare i dati con una funzione logistica certamente non è corretto, ma fino a quando sarà possibile farlo, mantenere questo modello permetterà di confrontare i dati acquisiti finora con i nuovi. Un cambio di modello, allo stato attuale, non è giustificato, anche tenendo conto del fatto che i parametri della curva che stiamo osservando in Italia sono del tutto analoghi a quelli osservati in altri Paesi (la Cina in primis).

Molti fisici tendono a valutare l’affidabilità delle proprie analisi sulla base di elementi oggettivi, come il cosiddetto chi-quadro del fit. Questi elementi si basano su una teoria della probabilità che tuttavia presenta importanti problemi di natura, diciamo cosí, filosofica. Bayes insegna che l’unica maniera corretta di stimare una probabilità è soggettiva. Una stima ragionevole di questa si può dare soltanto se si tiene conto di tutta una serie d’informazioni che possono non essere parte integrante del quadro matematico di riferimento. Per esempio, tutti sanno che lanciando un dado la probabilità di fare “4” è 1/6. Ma se dopo 1000 lanci osservo che il punteggio “4” è uscito 230 volte (quando il numero atteso è 170) la probabilità di vincere puntando sul “4” è maggiore semplicemente perché, molto probabilmente, il dado è stato realizzato in modo tale da favorire questo punteggio (intenzionalmente o meno non ha importanza).

Non do quindi troppo credito a modelli che si adattano meglio ai dati sperimentali da un punto di vista probabilistico, se non ho elementi ulteriori che mi fanno propendere verso una descrizione diversa da quella che uso, che non ha alcuna validità di principio, ma si fonda esclusivamente sull’osservazione sperimentale che essa descrive ragionevolmente bene i dati sperimentali, da un punto di vista puramente fenomenologico. I modelli alternativi alla curva logistica non sono migliori da un punto di vista di principio perché non aggiungono ipotesi ulteriori sulla diffusione della malattia supportate da evidenze sperimentali e spesso forniscono previsioni che non sono in linea con quanto osservato in altri contesti. Se lo sono, invece, non c’è ragione di preferirli ad altri.

Considerazioni sulla pericolosità del COVID19

In questi giorni la Prof.ssa Ilaria Capua è il bersaglio preferito di molti utenti della rete per le sue posizioni “minimaliste” riguardanti gli effetti del COVID19. Da una parte è comprensibile che chi si fa prendere dal panico reagisca in maniera scomposta e, da questo punto di vista, capisco (ma ovviamente non condivido) l’atteggiamento di chi esprime giudizi maleducati e aggressivi nei confronti della collega. D’altra parte, specie in situazioni come queste, niente aiuta più della ragione. Vediamo quindi di fare qualche conto per capire meglio cosa intende la Prof.ssa Capua quando “minimizza” la questione.

Secondo i dati forniti dalla Protezione Civile Nazionale, al momento in cui scriviamo, i morti per COVID19 (trascuriamo del tutto la differenza tra “morti per” e “morti con”, che a me pare del tutto irrilevante) sono 2.503, che corrispondono a 42 morti per milione di abitante. Naturalmente la distribuzione non è uniforme su tutto il territorio nazionale, quindi in effetti la mortalità è superiore. Poiché la Lombardia è di gran lunga la regione piú colpita consideriamo solo i dati di quella regione che sono statisticamente piú significativi. I morti in Lombardia sono 1640 (il 65% del totale) e gli abitanti sono 10 milioni, quindi COVID19 fa circa 1640/10 milioni di morti, corrispondenti a circa 160 vittime per milione.

Stando ai dati forniti dall’ISTAT, nel 2018 i morti in Lombardia sono stati 100.000, corrispondenti a 10.000 morti per milione. Considerando che i morti per COVID19 sono distribuiti grosso modo su un mese, mentre quelli dell’ISTAT su un anno, per fare un paragone bisogna dividere per 12 e quindi abbiamo che la mortalità ordinaria è di 800 morti per milione. Questo significa che, per effetto del COVID19, la mortalità aumenta del 20% circa (160/800).

Questo numero non è piccolo e informa di quanto sia in effetti importante mantenere alta l’attenzione sul fenomeno. Tuttavia vanno fatte altre considerazioni. Se non si tiene conto della distribuzione per età (quindi considerando tutte le fasce d’età allo stesso modo, il che è indubbiamente uno scenario molto pessimista), la probabilità di morire per COVID19 per un abitante della Lombardia è 1600/10 milioni, corrispondente allo 0.16 permille.

La probabilità di morire a causa di un tumore alle vie respiratorie, ad esempio, è dello 0.5 permille: tre volte più alta di quella per COVID19. Se si aggiungono le malattie croniche alle vie respiratorie passiamo all’1.7 permille: quasi dieci volte di piú. Questo, senza contare che tale probabilità è calcolata su tutta la popolazione inclusi i non fumatori e i bambini. Se si fuma la probabilità di contrarre una malattia all’apparato respiratorio che si rivelerà fatale aumenta enormemente, perciò quelli che hanno quest’abitudine farebbero bene a smettere di fumare piuttosto che a mettere una mascherina sulla bocca. Ogni volta che tolgono la mascherina per mettere una sigaretta in bocca inalano, con il 100% di probabilità, sostanze che certamente produrranno danni al loro organismo, mentre, allo stesso tempo, avranno una minima possibilità di ammalarsi di questa nuova malattia. Allo stesso tempo avranno dieci volte piú probabilità di morire in conseguenza di quel gesto (quello di accendere la sigaretta) rispetto a quella di non sopravvivere al coronavirus.

Spesso anche le patologie cardiovascolari sono legate ad abitudini di vita poco salutari, per le quali la mortalità raggiunge il 2.2 permille della popolazione (14 volte più alta del COVID19). Per carità, lungi da me l’idea d’imporre o anche solo suggerire abitudini considerate “sane”. Per quanto mi riguarda sono dell’idea di Woody Allen: preferisco vivere qualche mese in meno e continuare a poter fare quel che mi piace piuttosto che fare rinunce che mi peserebbero per sopravvivere qualche giorno in piú. L’importante è esserne coscienti.

In definitiva, è pur vero che il SARS-Cov-2 (nome proprio del coronavirus – nome comune – che causa la sindrome COVID19, la malattia) porta a un aumento sensibile della mortalità, ma è anche vero che in assoluto la mortalità complessiva risulta comunque bassa e decisamente inferiore a quella di altre patologie. L’invito è sempre, quindi, quello di pensare e, sopra tutto, d’imparare a fare un minimo di conti. La matematica non serve solo a questo. Spesso serve anche per migliorare il proprio umore, sollevarci da preoccupazioni e apprezzare quel che ci circonda. Fate i conti, non la guerra.

I dati aggiornati aggiornati giornalmente sulla diffusione dell’infezione da coronavirus sono sempre a disposizione di tutti all’indirizzo http://www.giovanniorgantini.it/covid19/covid19.html.