工業化以降の現代社会における私たちの思考方法は、概念の抽象化が進んでいることが特徴です。 科学的方法は私たちの世界を一変させ、それは私たちが日常的に世界について考える方法をも一変させた。 ピアジェはこれを形式的運用段階と呼びました。私たちは、現実の例から切り離された抽象的な概念を操作することによって思考するのです。 これは、工業化寸前のソビエト連邦の遠隔地の村での実験に見られるように、それほど遠くない祖先にとってはまったく異質なものでした。
抽象化はいたるところにあります。
ある意味で、私たちは抽象的な思考を強いられています。私たちは進化の祖先が見たことのない世界に住んでおり、環境が変化する速さに、そしてどのようなデジタル、知識ベースの領域へ変化するかについていこうとしているのは、ほとんどが概念的思考を行う私たちの能力なのです。 しかし、それは簡単なことではありません。 私たちの脳は、合理的かつ客観的になるように最適化されているわけではありません。 ウィキペディアには、約200の認知バイアス(知覚が現実を歪め、合理的な判断を妨げようとする心理的パターン)が掲載されています。
The False Confidence of Numbers
我々が出会う世界は不確実です。 現代の神経科学理論では、私たちの脳は、不確実性の下で常に最適な決定を下そうとする装置とみなされています。
パンデミックが世界中に広がり、私たちの知る生命、仕事、社会生活を脅かしている現在、不確実性はいたるところにあります。 数字は、私たちに何か安定したものを与えてくれるような、揺るぎない印象を与えてくれる。 数字が私たちを安心させるのは当然です。 数字は、世界に秩序をもたらし、それをうまく操作するための非常に有用な道具である。 数字は、火の発見以来、人類が行った最も重要な技術的進歩かもしれません。
しかし、数字は必ずしも数字と同じではありません。 数字には固有のリスクがつきものです。抽象化は難しく、科学的な調査は困難であり、数字はその発生の背後にある闘争、それが放射する客観的真実の後光の背後にある起源の不確実性を隠すことができます。
統計の難しさ
統計は、Wikipediaによると、データの収集、整理、分析、解釈、提示に関係しています。
数字はデータを表現する中心的方法のうちの1つです。 死亡率、症例総数、R0係数、対策の有効性の推定値などです。しかし、その背後には答えのない疑問が潜んでいることが非常に多いのです。
データが現実の客観的状態について教えてくれるものと考える前に、いくつかの重要な質問に答えなければなりません。
データ収集の重要性
Covid-19 は国際社会にとってほとんど前例のない挑戦であり(気候変動の話は置いておいて…)、世界中の人々が固唾を飲んでいる状態です。 ですから、このような環境では、実際に何が起こっているのかについて確かな感覚を与えてくれる数字を探すのは当然です。
しかし、ウイルスの蔓延を抑制するための対策は、科学実験ではないので、そのように扱うことには十分注意しなければなりません。 ウイルスのテストは実際の実験と大きく乖離し、バイアスが押し寄せる点がいくつかある。 これは事実であり、数値はかなりの塩梅で楽しむべきものであることを心に留めておくことが非常に重要です。
- 誰が検査を受けるのか? イラン、イタリア、中国などの「高リスク地域」から旅行してくる人々をテストすることがほとんどで、選択グループのバイアスを引き起こし、高リスク地域からのほとんどの人々が感染していることを示す偏った分布になる。 ピーク時の南コリアは1日あたり約1万件の検査を実施し、ドイツもその数に遠く及ばないが、他の国は検査数がはるかに少なく、それに応じて検出される感染者の数もはるかに少ない。 原理的には、感染者数が一定であっても、検出数が大きく伸びる可能性がある。
- 多くの人はほとんど症状がないか、非常に軽い症状しかないので、特に検査能力が過度に制限され、その結果、選択したグループから少数の人に制限される場合は、多くの人が検出されなくなることはないだろう。 最初の患者が確認される数週間前からウイルスが存在していたことが判明したワシントン州の状況は、この問題をよく表しています。
ですから、データ(死亡率はこんなもの、感染者数はこんなもの)を解釈しようとする前に、データがどのように収集されたかを理解する必要があります。
数日前、私の携帯電話の画面にウィジェットが表示され、確認された患者数が赤い文字で大きく表示されました:201463人がコロナウイルスに感染していたのです! 世界的な感染者数は10倍から50倍の誤差があることを考えると、一人一人をカウントするふりをすることは、データ収集プロセスの難しさを理解するのに役立つとは思えません。
症例致死率も同様によく投げかけられますが、ほぼ同じ量の不確実性が付随しています。非常に大きな交絡要因として人口統計学(ドイツでは患者の最大70パーセントがイタリアのスキー旅行から戻った健康な若者で、これも大きな選択グループバイアスを引き起こしています)があり、イタリアでは患者の大部分が高齢者で、イタリアの高齢者が社会生活にもっと強く溶け込んでいることも理由の一部です。 さらに、イタリアではおそらくもっと多くの未検出患者がいることでしょう(南チロルに休暇に行った帰りのドイツ人70人が、州全体で2例しか確認されていない時期に陽性と判定されたことを考えると、このことは明らかです)。 このことと、ドイツがより多く、より早く検査を開始したことにより、表面上は比較的似ている2つの国の間で死亡率にほぼ50倍の差が生じているのです。
それから、感染から回復までのタイムラグ、クリティカルケアの効果、喫煙と大気汚染の役割(イタリアと中国では高く、男性に多い)、国の人口統計、病院の能力、どの患者が Covid-19 による死亡としてカウントされるか(ドイツの最初の犠牲者は78歳の末期がん患者で、緩和ケアを行っていたので、彼の死をどの程度本当に Covid-19 で説明すべきかは議論があります)など、検討すべきことがあります。
したがって、「死亡率はこれこれである」と言い、「これらの数字だけに基づいてコヴィッド19が本当に危険かどうかを判断するのは誤解を招きやすい」のです。
ベイズの枠組みを採用する
ベイズ統計では、確率はある事象に対する確信の度合いを表します。 量のベイズ推定値は、常に量について知っていると思うことと、量の固有の不確実性の推定値を組み込んでいます。
数字はこの世界の知識を表します。しかしこの知識は必然的に確率的なので、ベイズ統計の量は単一の数字ではなく、確率分布(上のグラフのようにベルカーブになることもあります)で表現されます。 分布の幅は推定値の確からしさの度合いを表します。 グラフの最高点は我々の最良の推測(ガウスの平均)ですが、分布が本当に広い場合、我々の最良の推測はあまり多くを教えてくれません。
それに対する我々の可能な対策についてのこの素晴らしい詳細な考察が詳細に説明しているように、コビド19に関して言えば非常に多くの未知数があり、あまりにも多くの未知数が、あまり自信を持って数字を振り回すことができません(それはまた、より明確な画像を得るために時間を稼ぐので、強い対策は現在我々の最善の方針である理由を説明しています)。
Take this chart has traveled around the world and is from a paper published over the weekend by Neil Ferguson et al. 910>
そのメッセージがどれほど重要であるかは別として (米国と英国の政策変更につながりました)、このグラフの曲線の表現方法は誤解を招きかねません。 シミュレーションに差し込まれた暗黙のパラメータは何か、そしてその信頼区間はどのくらいか? 天候/異なる社会的距離の取り方/社会構造/出現する治療法の効果はすべて不確実であり、これらの要因はどれも実証研究によって決定されたものではなく、今のところ推測に過ぎません。
ジェレミー・ハワードが Covid-19 状況の実用的な要約で述べているように、これらの曲線は恐ろしいように見えますが、周囲のエラーバーは曲線自体のほぼサイズになり得るのです。
不確実性に耐える
結論:不確実性に直面して冷静でいることは難しいかもしれませんが、それなりの知恵はあります。
残念ながら、政治家においては、不確実性を認めることは弱さの表れと解釈されることが多いのです。 だからこそ、何が起きているのかを評価する上でどのような役割を果たすのか、私たちが取るべき対策に関してこれが何を意味するのか、そしてこの不確実性が、ウイルスをより厳密に、科学的に評価することによってゆっくりと征服し、その後最高の長期戦略を決定するためにもっと時間が必要な最良の理由の1つであると強調することが、科学界の責任であると考えています
私たち全員の頭の上にパンデミックの暗雲が迫っているときに持ち合わせる数字を持っていたいのです。 しかし、より明確な事実が明らかになる前に、国際社会が状況をよりしっかりと把握する前に、不確実性に耐える方が、自己欺瞞による快適さのために事実を永続させたり、逆に、何が起こっているかを実際よりもよく知っていると考えることから生じるパニックに自分自身を取りつかれさせたりするよりも良いのです」