Způsob myšlení v moderním postindustriálním světě se vyznačuje rostoucí pojmovou abstrakcí. Vědecká metoda proměnila náš svět a proměnila i způsob, jakým o světě každodenně přemýšlíme. Piaget to nazval formálním operačním stadiem: myslíme tak, že manipulujeme s abstraktními pojmy odtrženými od příkladů z reálného života. To bylo našim nepříliš vzdáleným předkům naprosto cizí, jak ukazují experimenty v odlehlých vesnicích Sovětského svazu na pokraji industrializace.
Abstrakce je všude: zatímco ještě před 100 lety se slovo procento téměř nikde neobjevovalo, dnes se objevuje zhruba v každém 5000. slově průměrného anglického textu a tvoří 0,02 % všech slov.
K abstraktnímu myšlení jsme svým způsobem nuceni: žijeme ve světě, jaký naši evoluční předkové neviděli, a jsou to především naše schopnosti pojmového myšlení, které se snaží držet krok s rychlostí, s jakou se naše prostředí mění a do jakých digitálních, na znalostech založených sfér se posouvá. Není to však triviální úkol. Naše mozky nejsou optimalizovány tak, aby byly racionální a objektivní:
Falešná důvěra v čísla
Svět ,jak se s ním setkáváme, je nejistý. Moderní neurovědecké teorie považují náš mozek za zařízení, které se neustále snaží přijímat optimální rozhodnutí v podmínkách nejistoty.
V době, kdy se po celém světě šíří pandemie, která ohrožuje životy, pracovní místa a společenský život, jak ho známe, je nejistota všudypřítomná.
Abstrahování světa se zbavuje hluku a rachotu reality a předstírá pocit objektivity tváří v tvář nejistotě. Čísla vzbuzují dojem nenapadnutelnosti, dávají nám něco stabilního, čeho se můžeme držet. Působí na nás uklidňujícím dojmem, a proč by neměla? Čísla jsou nesmírně užitečným nástrojem, jak vnést do světa řád, jak s ním úspěšně manipulovat. Jsou možná nejdůležitějším technologickým pokrokem, který lidstvo učinilo od objevení ohně.
Čísla se však vždy nerovnají číslům. Čísla s sebou nesou neodmyslitelné riziko: abstrakce je obtížná, vědecké zkoumání je obtížné a čísla mohou za svou genezí skrývat boj, za aureolou objektivní pravdy, kterou vyzařují, nejistotu původu.
Těžkosti statistiky
Statistika se podle Wikipedie zabývá sběrem, uspořádáním, analýzou, interpretací a prezentací dat.
Čísla jsou jedním z hlavních způsobů reprezentace dat. A v dnešní době se v médiích a ve veřejném diskurzu objevuje spousta čísel: úmrtnost, celkový počet případů, R0-faktory, odhady účinnosti protiopatření…ale velmi často ,se za nimi skrývají nezodpovězené otázky.
Předtím, než budeme předpokládat, co data vypovídají o objektivním stavu reality, je třeba zodpovědět několik klíčových otázek:
- Jak byla data shromážděna a uspořádána?
- Jak jsou prezentována?
- Jak mají být interpretována?
Důležitost sběru dat
Covid-19 je pro světové společenství téměř bezprecedentní výzvou (o klimatických změnách raději nemluvme…) a lidé na celém světě kvůli němu zadržují společný dech. V tomto prostředí je tedy přirozené hledat čísla, která nám dávají pocit jistoty o tom, co se skutečně děje.
Přijatá opatření proti ovládnutí šíření viru však nejsou vědeckým experimentem, a proto bychom s nimi měli zacházet velmi opatrně. Existuje několik bodů, v nichž se testování viru výrazně odchyluje od skutečného experimentu a v nichž dochází k zaplavení předsudky. Je velmi důležité mít na paměti, že tomu tak skutečně je a že čísla je třeba užívat se značnou rezervou.
- Kdo se testuje? Většinou se testují lidé cestující z „vysoce rizikových oblastí“ (jako je Írán, Itálie a Čína), což vyvolává zkreslení výběrové skupiny, které vede ke zkreslenému rozdělení, které naznačuje, že většinou se nakazili lidé z vysoce rizikových oblastí, i když by se mohli nakazit i lidé odjinud, ale zůstávají neodhaleni.
- Srovnávání čísel mezi jednotlivými zeměmi má omezenou hodnotu, protože počty testů se mezi nimi značně liší. Zatímco Jižní Korea na svém vrcholu prováděla kolem 10000 testů denně a Německo za tímto počtem příliš nezaostává, jiné země testují mnohem méně a v souladu s tím odhalují mnohem menší počty nakažených.
- Na některých místech v některých obdobích, zatímco počet pacientů s potvrzenou infekcí Covid-19 exponenciálně roste, rychle roste i počet testů. V zásadě by to mohlo vést k velkému nárůstu detekcí ,i kdyby počet nakažených zůstal konstantní.
- Mnoho lidí nemá téměř žádné příznaky nebo jen velmi mírné příznaky, a tak mnoho lidí nezůstane neodhaleno, zejména pokud jsou testovací kapacity přetížené, a proto se omezují na malý soubor lidí z vybraných skupin. Situace ve Washingtonu, kde se podařilo vysledovat přítomnost viru již několik týdnů před prvním potvrzeným případem, tento problém dobře podtrhuje.
Než se tedy budeme zabývat interpretací údajů (taková a taková je úmrtnost a takový je počet nakažených pacientů), musíme pochopit, jak byla data shromážděna.
Před několika dny ,se mi na displeji telefonu objevil widget, na kterém se červeným písmem rýsoval počet potvrzených případů: koronavirem se nakazilo 201463 lidí! Vzhledem k tomu, že skutečný počet celosvětových případů se může snadno lišit o desetinásobek až padesátinásobek, nemyslím si, že předstírání, že je počítáme až na jednotlivé osoby, pomáhá živit pochopení obtížnosti procesu sběru dat.
Podobně často se hovoří o úmrtnosti na případy, ale je s ní spojena téměř stejná míra nejistoty: mezi obrovské matoucí faktory patří demografie (až 70 procent pacientů v Německu jsou mladí lidé v dobré kondici, kteří se vracejí z lyžařských zájezdů v Itálii, což vyvolává další velké zkreslení výběru skupiny), zatímco v Itálii je velká část postižených starých lidí, částečně proto, že staří lidé v Itálii jsou silněji integrováni do společenského života. A pak je v Itálii pravděpodobně mnohem více nezjištěných případů (vezměte si, že 70 Němců vracejících se z dovolené v Jižním Tyrolsku bylo pozitivně testováno v době, kdy v celé zemi byly potvrzeny pouze 2 případy). To a skutečnost, že Německo začalo testovat více a dříve, vyvolalo téměř padesátinásobný rozdíl v úmrtnosti mezi dvěma na první pohled relativně podobnými zeměmi.
Dále je třeba vzít v úvahu časové prodlevy mezi infekcí a uzdravením, účinnost kritické péče, roli kouření a znečištění ovzduší (vysoké v Itálii a Číně a častější u mužů), demografické údaje o zemi, kapacitu nemocnic, otázku, kteří pacienti se započítávají do úmrtí na Covid-19 (první německou obětí byl 78letý pacient v pozdním stadiu rakoviny v paliativní péči, takže lze polemizovat, do jaké míry by jeho úmrtí mělo být skutečně započítáno do Covid-19) atd.
Je proto zavádějící říkat „počet úmrtí je takový a takový“, „a pouze na základě těchto čísel posuzovat, jak je Covid-19 skutečně nebezpečný. Pokud hovoříme o míře úmrtnosti, musíme si uvědomit, odkud pochází a co skutečně vypovídá.
Přijetí bayesovského rámce
V bayesovské statistice vyjadřují pravděpodobnosti míru naší víry v nějakou událost. Bayesovský odhad veličiny vždy zahrnuje to, co si myslíme, že o veličině víme, plus náš odhad vnitřní nejistoty veličiny.
Čísla vyjadřují naše znalosti o tomto světě: ale protože tyto znalosti jsou nutně pravděpodobnostní, jsou veličiny v bayesovské statistice místo jednotlivých čísel reprezentovány pravděpodobnostními rozděleními (která mohou mít podobu zvonové křivky jako ve výše uvedeném grafu). Šířka rozdělení představuje míru jistoty našeho odhadu. Nejvyšší bod grafu je náš nejlepší odhad (střední hodnota Gaussovy křivky), ale pokud je rozdělení opravdu široké, náš nejlepší odhad nám toho příliš mnoho neřekne.
Jak podrobně vysvětluje tento skvělý podrobný pohled na naše možná opatření proti němu, pokud jde o Covid-19, je zde velmi mnoho neznámých a příliš mnoho neznámých, než abychom mohli vládnout nějakými čísly s příliš velkou jistotou (vysvětluje to také, proč jsou silná opatření právě teď naší nejlepší politikou, protože nám získávají čas na získání jasnějšího obrazu).
Tak tento graf obletěl svět a pochází z článku, který o víkendu zveřejnili Neil Ferguson a kol. na Imperial College London.
Nezávisle na tom, jak důležité je jeho sdělení (vedlo ke změnám politiky v USA a Velké Británii), je způsob, jakým graf znázorňuje křivky, zavádějící. Jaké implicitní parametry byly do simulace zapojeny a jak velké jsou jejich intervaly spolehlivosti? Vliv počasí/různých měr sociálního odstupu/sociální struktury/nově vznikajících léčebných postupů je nejistý a žádný z těchto faktorů nebyl určen empirickými studiemi, ale jsou to zatím jen domněnky.
Jak říká Jeremy Howard ve svém praktickém shrnutí situace Covid-19, i když tyto křivky vypadají děsivě, chybové úsečky kolem nich mohou být téměř stejně velké jako křivky samotné.
Vyrovnat se s nejistotou
Závěr: tváří v tvář nejistotě je možná těžké zachovat klid, ale je v tom jistá moudrost.
Naneštěstí je u politiků přiznání nejistoty často interpretováno jako projev slabosti. Proto si myslím, že je povinností vědecké komunity zdůraznit, jakou roli hraje při vyhodnocování toho, co se děje, co to znamená s ohledem na opatření, která bychom měli přijmout, a proč je tato nejistota jedním z nejlepších důvodů, proč potřebujeme více času, abychom ji pomalu zdolávali prostřednictvím důkladnějšího vědeckého vyhodnocení viru a poté rozhodli o nejlepší dlouhodobé strategii.
Rádi máme čísla, kterých se můžeme chytit, když se nad hlavami nás všech vznáší temný mrak pandemie. Ale než se objeví jasnější fakta, než se světové společenství pevněji zorientuje v situaci, je lepší odolávat nejistotě, než se utvrzovat ve faktech, abychom si sami sobě nalhávali pohodlí, nebo na druhé straně propadat panice, která pramení z toho, že si myslíme, že víme lépe, co se děje, než ve skutečnosti víme.
.