Estimation du nombre réel d'infections au COVID-19: Comment aller au-delà des chiffres officiels.

21 avr. 2020

Si vous êtes comme moi, vous regardez probablement tous les jours le dénombrement des cas de contamination au coronavirus, et son taux effrayant d’augmentation : 1.000.000 cas dans le monde début avril, et déjà plus de 2.000.000 aujourd’hui, seulement deux semaines plus tard. Nous sommes pourtant tous d’accord sur une chose : ce chiffre n’est pas correct. Il ne correspond qu’au nombre de personnes ayant été testées positives. Ce qui nous amène donc à la question suivante : combien de cas y a-t-il en réalité ?

Dans cette article, nous étudierons ensemble comment les données disponibles sur le coronavirus peuvent être utilisées pour estimer l’efficacité du diagnostic de chaque pays. Ceci mettra en lumière de grosses disparités pouvant être liées à certaines décisions politiques, aux infrastructures de soins de santé propres à chaque pays ou à leur capacité à effectuer des tests. Nous verrons également que de nombreux pays possédant une politique similaire s’inscrivent dans la même fourchette de valeurs.

Cet article a pour objectif de montrer, de façon pédagogique, comment la combinaison du raisonnement logique et de l’analyse de données permet d’extraire des informations tangibles de données brutes. Les résultats mentionnés ici ne doivent cependant en aucun cas être considérés comme pure vérité, puisqu’ils reposent sur un bon nombre d’hypothèses.

 

Comment reconstruire les données manquantes ? 

Tout part des deux postulats suivants :

  • Le nombre de décès est plus précis que le nombre d’infections
  • Le taux de mortalité du virus ne devrait pas considérablement différer d’un pays à l’autre.

Il y a bien sûr plusieurs facteurs d’influence, à savoir : la répartition de la population par âge, le mode de vie (obésité…), la qualité des soins… mais ces paramètres sont peu susceptibles d’avoir un impact plus important qu’un facteur 2 ou 3 (allant de 2% en Corée du Sud à peut-être 4 ou 6 % dans d’autres pays).

Cependant, nous voyons des pays avec un taux de mortalité dans les 30%... soit 15 fois plus que la Corée du Sud ! Alors qu’est-ce qui entre en ligne de compte pour la plupart d’entre eux ? C’est ce que nous allons explorer, mais regardons d’abord comment calculer avec précision le taux de mortalité observé :

 

Le délai entre la contamination et le décès

Pour mesurer avec plus de précision le taux de mortalité, nous devons attribuer un décès à son jour de diagnostic. En effet, le délai entre le diagnostic et le décès couplé à la croissance exponentielle des cas produit un taux de létalité non constant dans le temps et qui sous-estime la réalité :

Figure 1: Cas diagnostiqués, décè enregistrés et taux de mortalité pour la Belgique
à la date réelle enregistrées à l'OMS.

 

Parce que l’information n’est pas connue pour chaque patient, nous allons devoir utiliser une durée moyenne pour déplacer la courbe dans le temps. Gardons à l’esprit que cette durée moyenne variera également d’un pays à l’autre, en fonction des capacités de test et de la qualité des soins de santé ainsi que leur disponibilité.

Figure 2. Illustration du délai entre le diagnotic et le décès pour l'Italie et la Suisse

 

Sur base de l’observation des pays les plus touchés par le virus, nous observons des délais variant généralement entre 7 et 11 jours. Nous avons donc décidé d’appliquer un décalage de 9 jours en moyenne à chaque pays pour effectuer le calcul corrigé du taux de mortalité.

Figure 3: Cas diagnostiqués, décès enregistrés et taux de mortalité pour la Belgique
avec des jours de décès décalés 9 jours plus tôt qu'il n'étaient communiqués à l'OMS.

 

Avant d’effectuer cette correction temporelle, nous pouvions observer un taux de mortalité apparent pour la Belgique en hausse, passant de 5% à 10% entre le 31 mars et le 9 avril. Après cette correction temporelle, il apparait désormais comme constant sur cette période, mais au rythme de 20 % !

A cet instant, il est important de noter que le taux de mortalité n’est pas de 20% des personnes infectées, compte tenu du fait que toutes les personnes infectées ne sont pas nécessairement diagnostiquées. Ce taux aux apparences élevées est dû à la très faible capacité de tests en Belgique et au fait que la plupart des tests ont été effectués sur des personnes nécessitant une hospitalisation. Il est également à noter que la Belgique a décidé d’inclure dans son dénombrement tous les décès suspects survenus en maison de retraite peu importe le diagnostic, impactant ainsi l’augmentation de ce taux.

 

Une petite parenthèse sur la Corée du Sud

Intéressons-nous quelques instants sur l’analyse de la stratégie de la Corée du Sud pour lutter contre le virus. Le taux de mortalité y est parmi les plus bas de tous les pays, avec 2% seulement. Comment cela s’explique-t-il ?

La Corée du Sud a effectué des campagnes de tests sur sa population de manière agressive, en utilisant une application sur le téléphone de chaque citoyen afin de suivre leurs déplacements. Concrètement, cela signifie qu’à partir du moment où un cas positif est détecté, le gouvernement peut rapidement identifier toutes les personnes ayant croisé le chemin de l’individu infecté et les avertir afin qu’elles puissent s’isoler et se faire tester. C’est de cette façon que la Corée du Sud est parvenue à limiter la propagation du virus sans avoir recours au confinement, en sauvant à la fois des vies et l’économie du pays. Et bien qu’un niveau de 100% de diagnostics n’est jamais atteint, il serait raisonnable de supposer que cette stratégie leur a permis de diagnostiquer un nombre élevé de cas, probablement proche de 100%.

 

Comment pouvons-nous alors estimer l’efficacité des diagnostics pour chaque pays ? 

Avec tout ce que nous venons de voir, nous pouvons émettre des hypothèses et extrapoler le pourcentage de personnes infectées qui sont effectivement diagnostiquées dans chaque pays. Les trois hypothèses étant :

  1. Le taux réel de décès n’est pas significativement différent d’un pays à l’autre.
  2. Le délai entre le diagnostic et le décès est en moyenne de 9 jours
  3. La Corée du Sud a atteint un taux de diagnostique proche de 100%

 

À partir de l’observation du taux de mortalité et des trois hypothèses précédemment évoquées, nous pouvons estimer le nombre réel de cas par pays et la proportion de ces cas réels qui ont été diagnostiquées. Les résultats sont présentés dans le graphique interactif ci-dessous :

 

 

Nous observons des fluctuations et évolutions dans le temps :

  • Revenons à l’exemple de la Belgique. Le taux de diagnostics était de l’ordre de 40% au début de la crise. Cependant, le nombre de cas augmentant, le pays n’est pas parvenu à augmenter ses capacités de test et est donc passer à côté de nombreux cas. Nous estimons actuellement que seules 9% des personnes infectées ont été diagnostiquées. Ce pourcentage est sensiblement le même pour les autres pays qui ont pris la décision de ne tester qu’en cas d’hospitalisation (France, Italie, Espagne, Pays-Bas…).
  • Prenons un autre exemple : mi-mars, le Luxembourg a décidé d’étendre ses tests à toutes les personnes souhaitant être testées. Nous pouvons clairement constater l’augmentation de la couverture de diagnostic grâce à ces mesures.
  • Enfin, nous observons certains pays avec des taux de diagnostic supérieurs à 100%. Cela pourrait signifier que la Corée du Sud n’était pas la bonne référence et que ces pays obtiennent en fait de meilleurs résultats. Il n’y a cependant aucune preuve solide qui indique qu’ils appliquent de meilleures méthodes de diagnostic. Il est donc plus probable que ces pays sous estiment en fait le nombre de décès (nous vous laissons le soin de décider par vous-même s’il s’agit chiffres trafiqués, ou simplement d’un manque de moyens).

Nous avons ainsi réussi à relier des données à des événements et à comprendre la situation. Ce type raisonnement est valable pour un large éventail d’applications (politique, santé publique, économie… ou la performance de votre entreprise) et fournit des informations qui aident à prendre de meilleures décisions.

Bien que les tendances présentées ici se maintiennent, veuillez noter qu’en raison du nombre élevé d’inconnues sur le Covid-19, les chiffres ne sont que des approximations et ne doivent être utilisés nulle part hors contexte.