Pandemia statisticilor proaste

, Author

Modul în care gândim într-o lume modernă, post-industrializată, este caracterizat de o abstractizare conceptuală din ce în ce mai mare. Metoda științifică a transformat lumea noastră și a transformat modul în care gândim despre lume zi de zi. Piaget a numit acest stadiu etapa operațională formală: gândim prin manipularea unor concepte abstracte detașate de exemple din viața reală. Acest lucru le era absolut străin strămoșilor noștri nu foarte îndepărtați, după cum reiese din experimentele efectuate în satele îndepărtate din Uniunea Sovietică, în pragul industrializării.

Abstracțiunea este peste tot: în timp ce cuvântul „procent” nu apărea aproape nicăieri în urmă cu doar 100 de ani, acum apare cam la fiecare 5.000 de cuvinte în textul mediu în limba engleză, reprezentând 0,02% din toate cuvintele.

Într-un fel, suntem forțați spre gândirea abstractă: trăim într-o lume care nu seamănă cu niciuna văzută de strămoșii noștri evolutivi și, în principal, facultățile noastre de gândire conceptuală sunt cele care încearcă să țină pasul cu rapiditatea cu care se schimbă mediul nostru și spre ce fel de tărâmuri digitale, bazate pe cunoaștere, se schimbă. Dar nu este o sarcină trivială. Creierul nostru nu este optimizat pentru a fi rațional și obiectiv: Wikipedia enumeră în jur de 200 de prejudecăți cognitive, modele psihologice în care percepția noastră distorsionează realitatea și ne împiedică să judecăm rațional.

Falsă încredere a numerelor

Lumea ,așa cum o întâlnim, este incertă. Teoriile neuroștiințifice moderne ne privesc creierul nostru ca pe un dispozitiv care încearcă în mod constant să ia decizii optime în condiții de incertitudine.

Într-o perioadă în care o pandemie se răspândește pe tot globul, amenințând vieți, locuri de muncă și viața socială așa cum o cunoaștem, incertitudinea este peste tot.

Astractizarea lumii ne scapă de zgomotul și zbuciumul realității, prefăcându-se într-un sentiment de obiectivitate în fața incertitudinii. Numerele dau o impresie de inatacabilitate, de a ne oferi ceva stabil de care să ne agățăm. Se simt reconfortante pentru noi, și de ce nu ar trebui să fie așa? Numerele ne-au oferit un instrument extrem de util pentru a pune ordine în lume, pentru a o manipula cu mare succes. Ele ar putea fi cel mai important progres tehnologic pe care omenirea l-a făcut de la descoperirea focului.

Dar numerele nu sunt întotdeauna egale cu numerele. Numerele vin cu un risc inerent: abstractizarea este dificilă, cercetarea științifică este dificilă, iar numerele pot ascunde lupta din spatele genezei lor, incertitudinea originii în spatele aureolei de adevăr obiectiv pe care o radiază.

Dificultățile statisticii

Statistica, conform Wikipedia, se referă la colectarea, organizarea, analiza, interpretarea și prezentarea datelor.

Numerele sunt una dintre modalitățile centrale de reprezentare a datelor. Și o mulțime de numere plutesc în mass-media și în discursul public în aceste zile: ratele de mortalitate, numărul total de cazuri, factorii R0, estimări ale eficacității contramăsurilor…dar foarte adesea ,în spatele lor se ascund întrebări fără răspuns.

Până a presupune ce spun datele despre starea obiectivă a realității, trebuie să se răspundă la câteva întrebări cheie:

  1. Cum au fost colectate și organizate datele?
  2. Cum sunt prezentate?
  3. Cum trebuie interpretate?

Importanța colectării datelor

Covidul-19 este o provocare aproape fără precedent pentru comunitatea globală (să nu vorbim despre schimbările climatice…) și îi face pe oamenii din întreaga lume să-și țină respirația colectivă. Așa că, în acest mediu, este firesc să căutăm cifre care să ne dea un sentiment de certitudine cu privire la ceea ce se întâmplă cu adevărat.

Dar măsurile luate împotriva domolirea răspândirii virusului nu sunt un experiment științific, așa că ar trebui să fim foarte atenți în a-l trata ca pe unul. Există mai multe puncte în care testarea virusului se abate în mod semnificativ de la un experiment real și în care se inundă prejudecățile. Este foarte important să reținem că acesta este, de fapt, cazul și că cifrele sunt acolo pentru a fi savurate cu un grăunte semnificativ de sare.

  1. Cine este testat? Testarea în cea mai mare parte a persoanelor care călătoresc din „zone cu risc ridicat” (cum ar fi Iran, Italia și China) induce o prejudecată de selecție a grupului, ceea ce duce la o distribuție înclinată care indică faptul că, în cea mai mare parte, persoanele din zonele cu risc ridicat au fost infectate, chiar dacă persoanele din alte părți ar putea fi la fel de bine, dar trec nedetectate.
  2. Compararea cifrelor între țări iare o valoare limitată, deoarece numărul de teste variază foarte mult între ele. În timp ce Coreea de Sud, în perioada de vârf, a efectuat aproximativ 10000 de teste pe zi, iar Germania nu este prea departe de acest număr, alte țări testează mult mai puțin și, în consecință, detectează un număr mult mai mic de infecții.
  3. În unele locuri, în anumite perioade, în timp ce numărul de pacienți cu o infecție confirmată cu Covid-19 crește exponențial, la fel și numărul de teste crește rapid. În principiu, acest lucru ar putea duce la o creștere mare a numărului de detecții ,chiar dacă numărul de persoane infectate a rămas constant.
  4. Multe persoane nu au aproape niciun simptom sau au doar simptome foarte ușoare și, prin urmare, multe persoane nu vor rămâne nedetectate, mai ales dacă capacitățile de testare sunt suprasolicitate și, prin urmare, limitate la un număr mic de persoane din grupuri selectate. Situația din Washington, unde virusul a fost depistat ca fiind prezent cu câteva săptămâni înainte de primul caz confirmat, subliniază bine această problemă.

Atunci, înainte de a căuta să interpretăm datele (așa și așa este rata mortalității și așa este numărul de pacienți infectați), trebuie să înțelegem cum au fost colectate datele.

Cu câteva zile în urmă ,pe ecranul telefonului meu a apărut un widget cu numărul de cazuri confirmate care se profilează cu litere roșii: 201463 de persoane au fost infectate cu coronavirusul! Având în vedere că numărul real de cazuri la nivel mondial ar putea fi ușor de 10-50 de ori mai mic, nu cred că a ne preface că le numărăm până la fiecare persoană în parte ajută la alimentarea unei înțelegeri a dificultății procesului de colectare a datelor.

Taxa de mortalitate este, de asemenea, aruncată des, dar are atașată o cantitate aproape egală de incertitudine: un factor de confuzie imens include datele demografice (până la 70 la sută dintre pacienții din Germania sunt tineri în formă bună care se întorc din excursiile de schi din Italia, ceea ce induce o altă mare prejudecată a grupului de selecție), în timp ce în Italia o mare parte dintre persoanele afectate sunt bătrâni, în parte pentru că bătrânii din Italia sunt mai puternic integrați în viața socială. Și apoi există probabil mult mai multe cazuri nedetectate în Italia (gândiți-vă că 70 de germani care se întorceau din vacanța din Tirolul de Sud au fost testați pozitiv într-un moment în care întregul stat avea doar 2 cazuri confirmate). Acest lucru, precum și faptul că Germania a început să testeze mai mult și mai devreme, a indus o diferență de aproape 50 de ori în ceea ce privește rata de mortalitate între două țări, la suprafață relativ similare.

Apoi trebuie luate în considerare decalajele de timp între infecție și vindecări, eficacitatea îngrijirii critice, rolul fumatului și al poluării aerului (ridicat în Italia și în China și mai răspândit în rândul bărbaților), demografia țării, capacitatea spitalelor, întrebarea care pacienți sunt contabilizați ca decese Covid-19 (prima victimă germană a fost un pacient în vârstă de 78 de ani, bolnav de cancer în stadiu avansat, aflat în îngrijire paliativă, astfel încât se poate argumenta în ce măsură decesul său ar trebui într-adevăr să fie contabilizat de Covid-19), etc.

Este, prin urmare, înșelător să spunem „rata de deces este asta și aia”, „și să judecăm cât de periculos este cu adevărat Covid-19 doar pe baza acestor cifre. Dacă vorbim despre o rată a mortalității, trebuie să fim conștienți de unde provine și ce spune ea cu adevărat.

Adoptarea unui cadru bayesian

În statistica bayesiană, probabilitățile exprimă gradul nostru de credință într-un eveniment. O estimare bayesiană a unei cantități încorporează întotdeauna ceea ce credem că știm despre cantitate, plus estimarea noastră a incertitudinii inerente a cantității.

Un set de distribuții de probabilitate gaussiene cu covarianțe diferite. Sursă: Inductiveload / Domeniu public

Numerele exprimă cunoștințele noastre despre această lume: dar cum aceste cunoștințe sunt în mod necesar probabilistice, cantitățile din statistica bayesiană sunt în schimb reprezentate prin distribuții de probabilitate (care pot fi o curbă în formă de clopot ca în graficul de mai sus) în loc de numere unice. Lățimea distribuției reprezintă gradul nostru de certitudine în estimarea noastră. Punctul cel mai înalt al graficului este cea mai bună presupunere a noastră (media gaussiană), dar dacă distribuția este foarte largă, cea mai bună presupunere a noastră nu ne spune prea multe.

După cum explică în detaliu această minunată analiză în profunzime a posibilelor noastre măsuri împotriva ei, există foarte multe necunoscute când vine vorba de Covid-19, și prea multe necunoscute pentru a mânui orice număr cu prea multă încredere (explică, de asemenea, de ce măsurile ferme sunt cea mai bună politică a noastră în acest moment, deoarece ne dau timp pentru a obține o imagine mai clară).

Treceți acest grafic a făcut înconjurul lumii și provine dintr-o lucrare publicată în weekend de Neil Ferguson et al. la Imperial College London.

Independent de cât de important este mesajul său (a dus la schimbări de politici în SUA și Marea Britanie), modul în care graficul reprezintă curbele este înșelător. Care sunt parametrii impliciți care au fost introduși în simulare și cât de mari sunt intervalele de încredere ale acestora? Efectele vremii/măsurilor diferite de distanțare socială/structurii sociale/tratamentelor emergente sunt toate incerte și niciunul dintre acești factori nu a fost determinat prin studii empirice, ci sunt, deocamdată, conjecturi.

Cum spune Jeremy Howard în rezumatul său practic al situației Covid-19, în timp ce aceste curbe arată îngrozitor, barele de eroare din jurul lor ar putea fi aproape de mărimea curbelor în sine.

Înfruntarea incertitudinii

Bottom line: poate fi greu să rămâi calm în fața incertitudinii, dar există o oarecare înțelepciune în acest sens.

Din păcate, în rândul politicienilor, recunoașterea incertitudinii este adesea interpretată ca un semn de slăbiciune. De aceea, cred că este responsabilitatea comunității științifice să sublinieze ce rol joacă în evaluarea a ceea ce se întâmplă, ce înseamnă acest lucru în ceea ce privește măsurile pe care ar trebui să le luăm și de ce această incertitudine este unul dintre cele mai bune motive pentru care avem nevoie de mai mult timp pentru a o cuceri încet-încet printr-o evaluare științifică mai riguroasă și mai riguroasă a virusului, iar apoi să decidem cea mai bună strategie pe termen lung.

Ne place să avem cifre de care să ne agățăm atunci când norul întunecat al pandemiei se profilează deasupra capetelor noastre, ale tuturor. Dar înainte de apariția unor fapte mai clare, înainte ca comunitatea globală să aibă o înțelegere mai fermă a situației, este mai bine să rezistăm incertitudinii decât să perpetuăm faptele de dragul de a ne auto-înșela în confort sau, la cealaltă extremă, să ne obsedăm într-o panică ce vine din faptul că credem că știm mai bine ce se întâmplă decât știm cu adevărat.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.