Hoe interactieve data visualisatie u een accurater beeld geeft van de evolutie van COVID-19

26 mrt 2020

Iedereen volgt met argusogen de evolutie van COVID-19 op. En juist nu hebben we besloten om… ja, inderdaad, nog een extra infografiek te maken over deze evolutie. We hadden het gevoel dat de data gevisualiseerd moesten worden vanuit een ander standpunt dan wat we meestal te zien krijgen, aangezien het aantal besmettingen per land niet het hele plaatje toont.

Dat is waarom we de data hebben bewerkt met bijkomende visualisatie-parameters: het aantal besmettingen per capita, dat de relatie legt tussen de verspreiding van het virus en het bevolkingsaantal van een land. We voegden ook een relatieve tijdsvisualisatie toe. Het virus stak niet overal terzelfdertijd de kop op, en tussen de import en de exponentiële verspreiding zagen we een verschillend tijdsverloop per land. Daarom corrigeerden we dit en zetten we op de tijdlijn elk land uit zodat de start van hun exponentiële groei samenviel op dezelfde datum (we kozen voor de startdatum van verspreiding in China). Deze grafische voorstelling laat daarom toe om vergelijkingen te maken tussen landen op 4 manieren:

  • Echte datum en absolute cijfers
  • Echte datum en cijfers per 1.000.000 inwoners
  • Relatieve datum en absolute cijfers
  • Relatieve datum en cijfers per 1.000.000 inwoners

In beide gevallen worden zowel de cumulatieve als de dagelijkse nieuwe gevallen getoond.

 

U kan hier met de data aan de slag:

 
Klik (ctrl+click) om één of meer landen te kiezen in de lijst op de linkerkant.
Gebruik de selectieknoppen om de data te visualiseren:
• Total Cases: dit geeft het totale aantal aan van bevestigde besmettingen
• Daily Cases: dit geeft het dagelijkse totaal aan van bevestigde besmettingen
• Infected numbers: dit geeft het totale aantal bevestigde besmettingen per land
• Infected per capita: dit geeft het totale aantal bevestigde besmettingen per 1.000.000 inwoners 
• Date: toont de werkelijke datum waarop de aantallen werden gerapporteerd
• Relative evolution: toont hoe de landen evolueren ten opzichte van elkaar doorheen de exponentiële verspreiding van de ziekte, met een startdatum die verschoven is om samen te vallen met de startdatum waarop het virus zich exponentieel begon te verspreiden in China. 

Onze belangrijkste conclusies:

Deze grafieken verschaffen verschillende inzichten, maar laten we er ééntje uitlichten:

De ogen van de wereld waren eerst gericht op China in februari, en nadien op Italië in maart. Maar terwijl Italië geleidelijk de piek van dagelijkse gevallen bereikt, tonen trends dat we in april de Verenigde Staten zullen zien als het belangrijkste epicentrum voor het virus, met een exponentiële groei die elk ander land zal overstijgen.

We moeten hierbij echter opmerken dat we alleen kunnen analyseren wat gemeten wordt, en we weten dat de metingen slechts een deel van de werkelijke besmettingen aangeven. De meeste landen testen enkel wie in een hospitaal wordt opgenomen (met uitzondering van Zuid-Korea en IJsland tot nu toe).

Laten we niet vergeten dat onvolledige data kunnen leiden tot verkeerde inzichten, en dus tot verkeerde conclusies. Daarom is deze studie enkel ter illustratie.

De huidige schattingen die kunnen afgeleid worden van het cruiseschip, Zuid-Korea en IJsland geven aan dat er een factor 5 tot 10 dient toegepast te worden op het aantal gemeten gevallen om het échte aantal besmette personen in te schatten. Veel mensen ontwikkelen geen symptomen, en een massale testmeting achteraf is niet zo waarschijnlijk. We kunnen dus potentieel te maken hebben met 4.500.000 besmettingen in plaats van 450.000… maar het werkelijke aantal zullen we wellicht nooit weten.

De cijfers die we hier visualiseren kunnen gebruikt worden om trends tussen landen te vergelijken, maar mogen niet beschouwd worden als een betrouwbare waarheid voor conclusies of schattingen van het werkelijke aantal gevallen.