Pahojen tilastojen pandemia

, Author

Ajattelutavoillemme nykyaikaisessa, jälkiteollisessa maailmassa on ominaista lisääntyvä käsitteellinen abstraktius. Tieteellinen menetelmä on muuttanut maailmaamme, ja se on muuttanut tapamme ajatella maailmaa päivittäin. Piaget kutsui tätä muodolliseksi operationaaliseksi vaiheeksi: ajattelemme manipuloimalla abstrakteja käsitteitä irrallaan todellisista esimerkeistä. Tämä oli täysin vierasta ei-niin-kaukaisille esi-isillemme, kuten kokeilut Neuvostoliiton syrjäisissä kylissä teollistumisen kynnyksellä osoittavat.

Abstraktiota on kaikkialla: kun sana prosentti ei esiintynyt juuri missään vielä sata vuotta sitten, se ilmestyy nykyään noin joka 5 000. sana keskiverto englanninkielisessä tekstissä, ja sen osuus kaikista sanoista on 0,02 prosenttia.

Meidät on tavallaan pakotettu abstraktiin ajatteluun: elämme maailmassa, jollaista evolutiiviset esi-isämme eivät ole nähneet, ja lähinnä käsitteellisen ajattelun kykymme yrittää pysyä mukana siinä nopeudessa, jolla ympäristömme muuttuu, ja siinä, millaisiin digitaalisiin, tietoon perustuviin valtakuntiin se siirtyy. Tehtävä ei kuitenkaan ole triviaali. Aivojamme ei ole optimoitu rationaalisiksi ja objektiivisiksi: Wikipedia luettelee noin 200 kognitiivista ennakkoluuloa, psykologista mallia, joissa havaintomme vääristää todellisuutta ja pitää meidät poissa rationaalisesta arvostelukyvystä.

Lukujen väärä luottamus

>Maailman ,sellaisena kuin kohtaamme sen, on epävarma. Nykyaikaiset neurotieteelliset teoriat pitävät aivojamme laitteina, jotka yrittävät jatkuvasti tehdä optimaalisia päätöksiä epävarmuuden vallitessa.

Aikana, jolloin pandemia leviää ympäri maailmaa ja uhkaa ihmishenkiä, työpaikkoja ja sosiaalista elämää sellaisena kuin me sen tunnemme, epävarmuus on kaikkialla.

Maailman abstrahoinnilla päästään eroon todellisuuden hälystä ja kolinasta, ja se teeskentelee objektiivisuutta epävarmuuden edessä. Numerot antavat vaikutelman koskemattomuudesta, antavat meille jotain vakaata, josta pitää kiinni. Ne tuntuvat meistä lohdullisilta, ja miksipä eivät tuntuisikaan? Numerot ovat olleet erittäin hyödyllinen väline, jonka avulla maailmaan on voitu tuoda järjestystä ja manipuloida sitä suurella menestyksellä. Ne ovat ehkä tärkein teknologinen edistysaskel, jonka ihmiskunta on tehnyt tulen löytämisen jälkeen.

Mutta luvut eivät aina ole yhtä kuin numerot. Numeroihin liittyy luonnostaan riski: abstrahointi on vaikeaa, tieteellinen tutkimus on vaikeaa, ja numerot voivat kätkeä taistelujaan niiden synnyn taakse, alkuperän epävarmuutta niiden säteilemän objektiivisen totuuden sädekehän taakse.

Tilastotieteen vaikeudet

Tilastotiede käsittelee Wikipedian mukaan datan keräämistä, järjestämistä, analysoimista, tulkintaa ja esittämistä.

Luvut ovat yksi keskeisimpiä tapoja esittää tietoa. Ja nykyään tiedotusvälineissä ja julkisessa keskustelussa liikkuu paljon numeroita: kuolleisuuslukuja, tapausten kokonaislukuja, R0-kertoimia, arvioita vastatoimenpiteiden tehokkuudesta…mutta hyvin usein ,niiden takana piilee vastaamattomia kysymyksiä.

Ennen kuin voi olettaa, mitä tiedot kertovat todellisuuden objektiivisesta tilasta, on vastattava joihinkin avainkysymyksiin:

  1. Miten tiedot kerättiin ja järjestettiin?
  2. Miten se esitetään?
  3. Miten sitä tulkitaan?

Datan keräämisen merkitys

Covid-19 on lähes ennennäkemätön haaste maailmanlaajuiselle yhteisölle (älkäämme puhuko ilmastonmuutoksesta…), ja se on saanut ihmiset kaikkialla maailmassa pidättämään kollektiivista hengitystään. Niinpä tässä ympäristössä on luonnollista etsiä lukuja, jotka antavat meille varmuuden tunteen siitä, mitä todella tapahtuu.

Viruksen leviämisen hillitsemiseksi toteutetut toimenpiteet eivät kuitenkaan ole tieteellinen koe, ja siksi meidän on oltava hyvin varovaisia suhtautuessamme siihen kuin sellaiseen. On useita kohtia, joissa viruksen testaaminen poikkeaa merkittävästi todellisesta kokeesta ja joissa ennakkoluulot tulvivat mukaan. On erittäin tärkeää pitää mielessä, että näin todella on ja että luvuista on nautittava huomattavan suurella varauksella.

  1. Ketä testataan? Useimmiten ”riskialueilta” (kuten Iranista, Italiasta ja Kiinasta) tulevien ihmisten testaaminen aiheuttaa valintaryhmien harhaa, mikä johtaa vinoutuneeseen jakaumaan, joka osoittaa, että suurimmaksi osaksi riskialueilta tulevat ihmiset ovat saaneet tartunnan, vaikka myös muualta tulevat ihmiset voisivat saada tartunnan, mutta jäävät havaitsematta.
  2. Lukujen vertailu eri maiden välillä on arvoltaan vähäistä, koska testien määrät vaihtelevat suuresti maiden välillä. Vaikka Etelä-Koreassa on parhaimmillaan tehty noin 10 000 testiä päivässä, eikä Saksa ole kaukana tästä määrästä, muissa maissa testataan paljon vähemmän ja havaitaan vastaavasti paljon vähemmän tartuntoja.
  3. Jossain paikoissa tiettyinä ajanjaksoina vahvistetun Covid-19-tartunnan saaneiden potilaiden määrän kasvaessa räjähdysmäisesti myös testien määrä kasvaa nopeasti. Periaatteessa tämä voisi johtaa havaintojen suureen kasvuun ,vaikka tartunnan saaneiden määrä pysyisi vakiona.
  4. Monilla ihmisillä ei ole juuri lainkaan oireita tai vain hyvin lieviä oireita, joten monet ihmiset eivät jää havaitsematta, varsinkin jos testauskapasiteetti on ylikireä ja rajoittuu siksi pieneen joukkoon valikoitujen ryhmien ihmisiä. Washingtonin tilanne, jossa viruksen jäljitettiin olleen olemassa useita viikkoja ennen ensimmäistä vahvistettua tapausta, korostaa hyvin tätä ongelmaa.

Ennen kuin siis alamme tulkita tietoja (tällainen ja tällainen on kuolleisuusaste ja tällainen on tartunnan saaneiden potilaiden määrä), meidän on ymmärrettävä, miten tiedot on kerätty.

Pari päivää sitten puhelimeni näytölle ilmestyi widget, jossa vahvistettujen tapausten määrä näkyi punaisin kirjaimin: 201463 ihmistä oli saanut koronavirustartunnan! Kun otetaan huomioon, että maailmanlaajuisten tapausten todellinen määrä voi helposti poiketa 10-50-kertaisesti, en usko, että niiden laskemisen teeskentely yksittäiseen henkilöön asti auttaa ymmärtämään tiedonkeruuprosessin vaikeutta.

Tapahtumakuolleisuusprosenttia heitellään niin ikään usein, mutta siihen liittyy lähes yhtä paljon epävarmuutta: valtavaan sekoittavaan tekijään kuuluu demografia (jopa 70 prosenttia potilaista Saksassa on nuoria hyväkuntoisia nuoria, jotka palaavat hiihtoreissuilta Italiasta, mikä aiheuttaa toisen ison valintaryhmän vääristymän), kun taas Italiassa suuri osa sairastuneista on vanhoja, osittain siksi, että Italiassa vanhukset ovat vahvemmin integroituneet yhteiskuntaelämään. Lisäksi Italiassa on luultavasti paljon enemmän huomaamattomia tapauksia (70 Etelä-Tirolin lomalta palaavaa saksalaista testattiin positiivisesti, kun koko osavaltiossa oli vain kaksi vahvistettua tapausta). Tämä ja se, että Saksassa alettiin testata enemmän ja aikaisemmin, on johtanut siihen, että kuolemantapausten määrässä on lähes 50-kertainen ero kahden päällisin puolin suhteellisen samanlaisen maan välillä.

Sitten on otettava huomioon viiveet tartuntojen ja toipumisten välillä, tehohoidon tehokkuus, tupakoinnin ja ilmansaasteiden merkitys (korkea Italiassa ja Kiinassa ja yleisempi miesten keskuudessa), maan demografiset tekijät, sairaaloiden kapasiteetti, kysymys siitä, mitkä potilaat lasketaan Covid-19-kuolemiksi (ensimmäinen saksalainen uhri oli 78-vuotias myöhäisvaiheen syöpäpotilas, joka oli palliatiivisen hoidon piirissä, joten voidaan kiistellä siitä, missä määrin hänen kuolemansa pitäisi oikeasti lukea Covid-19:n piiriin kuuluviksi kuolemantapauksiksi), jne.

Sen vuoksi on harhaanjohtavaa sanoa, että ”kuolemantapausten määrä on sitä ja tätä”, ”ja arvioida Covid-19:n todellista vaarallisuutta pelkästään näiden lukujen perusteella”. Jos puhumme kuolleisuusluvusta, meidän on oltava tietoisia siitä, mistä se on peräisin ja mitä se todella kertoo.

Bayesilaisen viitekehyksen omaksuminen

Bayesilaisessa tilastotieteessä todennäköisyydet ilmaisevat uskomuksemme astetta jonkin tapahtuman suhteen. Bayesilainen estimaatti suureesta sisältää aina sen, mitä uskomme tietävämme suureesta, sekä arviomme suureen sisältyvästä epävarmuudesta.

Sarja Gaussin todennäköisyysjakaumia, joilla on erilaiset kovarianssit. Lähde: Inductiveload / Public domain

Luvut ilmaisevat tietämystämme tästä maailmasta: mutta koska tämä tietämys on väistämättä probabilistista, Bayesilaisessa tilastotieteessä suureet esitetään sen sijaan yksittäisten lukujen sijaan todennäköisyysjakaumilla (jotka voivat olla kellokäyrä kuten yllä olevassa kuvaajassa). Jakauman leveys edustaa arviomme varmuusastetta. Kuvaajan korkein piste on paras arvauksemme (gaussin keskiarvo), mutta jos jakauma on todella leveä, paras arvauksemme ei kerro meille kovinkaan paljon.

Kuten tämä loistava syvällinen katsaus mahdollisiin toimenpiteisiimme sitä vastaan selittää yksityiskohtaisesti, Covid-19:n suhteen on hyvin paljon tuntemattomia, ja liian paljon tuntemattomia tuntemattomia, jotta voisimme käyttää mitään numeroita liian luottavaisin mielin (se selittää myös sen, miksi vahvat toimenpiteet ovat parasta politiikkaamme juuri nyt, koska ne ostavat meille aikaa saadaksemme selkeämmän käsityksen).

Tämä kaavio on kulkenut maailmalla, ja se on viikonloppuna julkaistusta artikkelista Neil Ferguson et al. Imperial Collegessa Lontoossa.

Riippumatta siitä, kuinka tärkeä sen sanoma on (se johti politiikan muutoksiin Yhdysvalloissa ja Yhdistyneessä kuningaskunnassa), tapa, jolla kuvaaja esittää käyrät, on harhaanjohtava. Mitkä ovat implisiittiset parametrit, jotka kytkettiin simulaatioon, ja kuinka suuret ovat niiden luottamusvälit? Sään/erilaisten sosiaalisten etäisyysmittareiden/sosiaalisen rakenteen/alkavien hoitojen vaikutukset ovat kaikki epävarmoja, eikä mitään näistä tekijöistä ole määritetty empiirisillä tutkimuksilla, vaan ne ovat toistaiseksi vain arvailuja.

Kuten Jeremy Howard toteaa Covid-19-tilanteen käytännönläheisessä yhteenvedossaan, vaikka nämä käyrät näyttävät kauhistuttavan näköisiltä, niiden ympärillä olevat virhepalkit voivat olla melkeinpä yhtä suuria kuin itse käyrät.

Sietää epävarmuutta

Lopputulos: voi olla vaikeaa pysyä rauhallisena epävarmuuden edessä, mutta siinä on jotain viisautta.

Poliitikoissa epävarmuuden tunnustaminen tulkitaan valitettavasti usein heikkouden merkiksi. Siksi mielestäni tiedeyhteisön vastuulla on korostaa, mikä rooli sillä on arvioitaessa, mitä on tapahtumassa, mitä se tarkoittaa niiden toimenpiteiden kannalta, joihin meidän pitäisi ryhtyä, ja miksi tämä epävarmuus on yksi parhaista syistä siihen, että tarvitsemme lisää aikaa, jotta voimme hitaasti valloittaa sen viruksen tiukemman tieteellisen arvioinnin avulla ja päättää sitten parhaasta pitkän aikavälin strategiasta.

Meistä on mukavaa, että meillä on numeroita, joista voimme pitää kiinni silloin, kun pandemian synkkä pilvi häämöttää päämme yllä. Mutta ennen kuin selkeämmät tosiasiat tulevat esiin, ennen kuin maailmanlaajuinen yhteisö on saanut vankemman käsityksen tilanteesta, on parempi kestää epävarmuus kuin ylläpitää tosiasioita sen vuoksi, että itsepetämme itsemme mukavuudenhaluisiksi, tai toisessa ääripäässä, että ajaudumme pakkomielteisesti paniikkiin, joka johtuu siitä, että luulemme tietävämme paremmin, mitä on tekeillä, kuin mitä todellisuudessa tiedämme.

Vastaa

Sähköpostiosoitettasi ei julkaista.