Van algoritme 0 naar algoritme 1

  • Code

Vandaag is het 16 april 2020. Op 9 april namen ze een adempauze om over hoe nu verder te overleggen.

Meneer Buddy stelde voor om de gemeten en de gemaakte aantallen vanaf het begin naast elkaar zichtbaar te maken en niet te vertrouwen op het maken van vergelijkingen ad hoc (zoals op 9 april). Zifter is dat met hem eens en vindt dat nieuwe versies van het model zo moeten worden ingericht dat de resultaten methodologisch correct en volgens de regels kunnen worden getoetst. Meneer Winnaar is bezorgd over wat het allemaal gaat kosten en wil dat versies zo worden ingericht dat ze kunnen worden hergebruikt met behulp van het anders instellen van beginwaarden. Bovendien stelt hij de eis dat programma’s zodanig worden gedocumenteerd dat als een nieuwe programmeur het werk moet oppakken die het kan voortzetten inplaats van overnieuw te moeten beginnen. En meneer Knoop, die het allemaal moet programmeren wijst erop dat elke nieuwe versie een gezamenlijke evaluatievergadering zal vragen waarbij evaluatiemateriaal onafhankelijk moet zijn gemeten en verzameld en waar voorstellen over het vervolg worden besproken.

Ze leggen hun overwegingen voor aan meneer Sum die bevoegd is. Deze geeft het groene licht om alle genoemde wensen in een nieuwe versie van algoritme 0 te verwezenlijken en het resultaat algoritme 1 te noemen. Hier is de uitdraai van een eerste test:

Algoritme 1 – eerste testrun op 16 april 2020

Aan de wens van Buddy is tegemoetgekomen door de startdatum van het model op 29 december 2019 te bepalen en om naast de waarden van het model ook de waarden die werden waargenomen te laten zien. (Aan het programma is een lijst toegevoegd met gegevens, ontleend aan worldometer.) De wens van Winnaar kreeg vorm door de gebruiker de gelegenheid te geven 10 beginwaarden (parameters) in te stellen: het aantal perioden in het venster dat wordt getoond; de eerste periode in dat venster; de lengten van de incubatieperiode, de gemiddelde ziekteduur en de periode waarin kan worden besmet (alle gesteld op 5 dagen, de duur van één periode of generatie); de overlevings- en immunititsratio’s, het reproductiegetal; de datum van de oorsprong van de pandemie; een schalingsfactor voor af te drukken getallen; een calibreringschuifje omdat de werkelijke datum van oorsprong onbekend is. Voorts kreeg meneer Knoop de opdracht zijn programma doeltreffend te documenteren. Het is hier. De wens van Zifter is gehonoreerd door de beginwaarden zichtbaar te maken tezamen met wat het algoritme oplevert, geplaatst naast wat is geregistreerd. Methodisch correcte interpretatie kan op basis hiervan plaatsvinden. De wens van Knoop kan in en gelijktijdig met het (normatieve) debat over de interpretatiekwesties worden verwezenlijkt.

Interpretatie (het normatieve debat)

Wat de eerste test van algoritme 1 in de grafiek laat zien zijn de waargenomen waarden in rood en de berekende waarden in zwart over een aantal van 17 perioden, beginnend bij periode 5. Een eerste indruk is dat totdat de lijnen elkaar kruisen (dat moet in het begin van periode 19 zijn) ze redelijk vergelijkbaar gedrag vertonen, terwijl ze daarna beide omhoog gaan, maar dat het model veel steiler stijgt dan wat is waargenomen in de wereld. Meneer Zifter is bang dat het moeilijk is te zien wat er voorafgaand aan periode 19 gebeurt omdat de grafiek is geschaald naar ver uiteenlopende uiterste waarden.

Meneer Buddy vindt dat het belangrijk is om eerst te bekijken of de vergelijkbaarheid verbetert wanneer het reproductiegetal wordt aangepast. In de tweede en de derde testrun wordt dat onderzocht. In de tweede is het reproductiegetal op 1.9 gezet en in de derde op 2.1. dat levert aanmerkelijk verschillende beelden op. Duidelijk is dat bij een reproductiegetal van 1.9 het model zich langer enigszins laat vergelijken met wat is waargenomen. Het moment waarop dat nieuwe model serieus gaat afwijken van wat werd waargenomen, zo lijkt het, verschuift van periode 15 naar periode 18. Zifter maakt opnieuw een voorbehoud omdat hij vindt dat het model bij de tweede poging structureel een onderschatting geeft die een verklaring behoeft.

In de vierde test is het beeld gecalibreerd met behulp van parameterinstelling. Als een verschil van drie periodes wordt aangenomen te bestaan tussen de twee aanvankelijk gebruikte datums van oorsprong, en wanneer de reproductiefactor op 1.8 wordt gesteld ontstaat het beeld van test 4. Alle vier zijn de heren van oordeel dat dit beeld het meest in aanmerking komt voor meer serieuze interpretatie. Daarbij zou dan een verklaring moeten worden gevonden waarom de eerste vijf perioden niets werd geregistreerd terwijl in de daarop volgende 7 perioden de registraties veel hoger waren dan de verwachtingen van het model. Denkbaar is dat er door alle onzekerheden van een nieuw virus en de vrees voor een pandemie de registratie van de eerste twee maanden weinig nauwkeurig is geweest en bovendien dat het niet serieus genoeg werd genomen zodat in de eerste periode het repoductiegetal wellicht hoger is geweest. Als dat mag worden aangenomen volgt een groep van drie perioden waarin de werkelijkheid het model volgt, een verklaring kan zijn dat in die periode het reproductiegetal naar 1.8 is gezakt omdat de dreiging van het virus duidelijk werd en men voorzichtiger begon te worden.

In de vijfde test zijn alle parameterinstellingen van test nummer vier behouden, alleen het aantal perioden in het venster is verhoogd van 17 naar 20. Het is opmerkelijk hoe de varandering van schaal de aandacht richt op verschillende aspecten. In test vijf komt vooral naar voren hoezeer na periode 17/22 het model zijn eigen weg gaat en los raakt van de waarnemingen. Een voor de hand liggende verklaring lijkt dat rond 27 maart 2020 in heel Europa maatregelen werden genomen.

Welnu, iedereen is het er over eens dat het model niet deugt wanneer wordt aangenomen dat het een beschijving van de werkelijkheid op de langere termijn zou beogen. Maar dat kan alleen in redelijkheid worden aangenomen voor een beperkte periode, bijvoorbeeld in het begin van een epidemie, wanneer er nog geen maatregelen zijn genomen en iedereen nog bevattelijk is. Voor de langere termijn moet het model worden aangepast. Maar misschien geldt dat ook voor de kortere termijn, zoals het beeld van test vier suggereert.

Het debat over hoe het verder moet met het model van algoritme 1 eindigt in de conclusie dat het tentatief kan worden benut aan het begin van een nog onbekende epidemie om via een periode van waarnemen en calibreren een schatting te maken van het basisreproductiegetal. Voor het overige lijkt het model onbruikbaar.

Het ligt voor nu de hand, zo menen de heren, om eerst te kijken naar hoe een op het dogmatische SIR model gebaseerd algoritme (algoritme 2, dus) zich houdt in het licht van de getallen die zijjn en nog worden waargenomen.