これ、とっても良い「みんなの家庭医学」のサンプルになると思うので、題材にしてみましょう。
まず、途中で脱落しそうな人のために、これだけは覚えて帰ってほしいのですが「検査に100%正確なものはありません」ということです。
では、どのぐらい正確・不正確なのか?
それを判定するための図をこちらに貼り付けておきます。「うわーいっぱいムズカシイ言葉が出てきて目がつぶれる!」ってなると思いますが、だいじょうぶです。まず必要になるのは真ん中の4つだけです。
- 真陽性:検査で「陽性」と診断されて、本当に病気がある(正解!)
- 真陰性:検査で「陰性」と診断されて、本当に病気がない(正解!)
- 偽陽性:検査で「陽性」と診断されたが、本当は病気でない(間違い)
- 偽陰性:検査で「陰性」と診断されたが、本当は病気である(間違い)
この4つは、理解できますよね?
仮に、検査の正確さが100%であれば、「真陽性」と「真陰性」しかないので、ややこしい議論は必要がありません。おそらく皆さんが思っている検査というのは、これでしょう。
ところが、現実世界の検査に正確さが100%のものはないので、「検査の結果」の陽性・陰性と、「本当の状態」の陽性・陰性との掛け算で、4つの場合分けが存在するわけです。そして検査を行った全員が、この4つの箱のどこかに入ります。
偽陽性は、病気でもないのに病人だと思われてしまうこと。
偽陰性は、病気なのに見落とされてしまうこと。
ここまではいいですか?
さて、検査の正確さをはかる指標には2つあります。それが「感度」と「特異度」です。たとえばインフルエンザの迅速診断の検査キットなら「感度60%・特異度98%」というように表記して、検査の性能をあらわします。
- 感度:実際に病気の人をきちんと陽性と診断できる確率
- 特異度:実際には病気でない人をきちんと陰性と診断できる確率
さきほどのインフルエンザの検査なら、
- 感度60%なので、病人が100人いたら60人は陽性になり、40人が間違って陰性になります。
- 特異度98%なので、健康な人が100人いたら98人は陰性になり、2人が間違って陽性になります。
感度が低いと、間違って陰性が多くなるのがわかりますかね。
インフルエンザっぽい症状で病院行くと、熱が上がりきってからまた日を改めて来いって追い返されたことないですか?あれは、検査の感度が低いのでウイルスが十分に増えてからでないと陽性にならないっていう意味なんです。
孫さんの簡易検査キット、おそらくインフルエンザの検査キットと似たような性能になると考えられます。というわけで、「感度60%・特異度98%」と仮定しましょう。
さて、準備はできました。
最後に決め手になるのは、「事前確率」という概念です。これを説明するために、ダイヤモンド・プリンセスのデータを使ってみましょう。
乗客3711人のうち、陽性と判定されたのは705人(余談:船内の環境とウイルスの感染力を考えると驚くほど少ない)、その半分以上は無症状でした。そして死者は6人。致死率は0.85%。
実は感染研のPCR検査は高性能で、「感度95%・特異度99.9%」ぐらいあると考えられています。ここでは便宜上100%として、上記の705人の陽性は「真の感染者」であるとします。
では、この乗客3711人からランダムに1人を連れてきて孫さんの検査キットを受けてもらうことを考えてみましょう。
このとき、この人が「真の感染者」である確率はどのぐらいでしょう?705 / 3711 = 19%です。これを「事前確率」と呼びます。(有病率、ともいいます)
では、ここでツールに登場してもらいましょう。
感度60、特異度98、有病率19と入力していくと、「陽性適中率」と「陰性適中率」が計算できます。この2つが、検査結果を評価するときに必要になる数字です。
この「陽性適中率」というのが重要な結果で、英語では precision といいます。機械学習とかAI界隈の人は PPV (Positive Predictive Value) って呼ぶことも多いですね。
さて、陽性適中率88%ということで、
- 検査結果が陽性だった場合:88%の確率で感染者を感染者と正しく判定でき、残り12%は実際には感染していない偽陽性
- 検査結果が陰性だった場合:91%の確率で健常者を健常者と正しく判定でき、残り9%は実際には感染している偽陰性
となります。
どうでしょう。んー、そこそこミスあるけど、全然だめってほどでもない感じ?
では次に、この孫さんの検査キットを100万人にばらまいて、日本全国の津々浦々の皆さんに受けていただくことを考えてみましょう。
厚生労働省サーベイランスの3月12日現在のデータでは、累計の検査数9376人、陽性者604人です。この検査は、これまでのところ濃厚接触などの背景のある、「疑惑」の濃い人達だけに検査されていることに注意してください。それでも、実際に陽性になる確率は604 / 9376 = 6%しかありませんね。
ただ、感染したけれど重症化せず、検査にも行かずに風邪と区別がつかないまま回復した人なども沢山いますので、多めに見積もって、隠れ陽性者は判明している数の10倍いると仮定しましょう。つまり6000人ですね。
さて、ここではなるべく単純化した話をしたいので、日本全国1億2000万人のみんなが、興味本位で孫さんの検査キットを買って検査するとします。100万キットがすぐ売り切れ、事実上、1億2000万人のうちからランダムに選ばれた100万人が検査をするという意味です。
この場合の事前確率(有病率)はどうでしょうか?先程の隠れ陽性者6000を1億2000万で割ると0.005%です。これを先程のツールに入れて計算してみましょう。
さて、どのぐらいの数字になるか、当ててみてください。当たるかな?
????????
よく数字が見えないって?
では拡大して差し上げましょう。
陽性適中率0.1%!!!
検査をして1000人に陽性が出たら、本当に感染しているのはたったの1人!!!
残りの999人は偽陽性、つまり本当は感染してないのに陽性と診断される!!!
ランダムな100万人がキットを買ったら、そのうち50人(6000*100万/1.2億)が実際に感染していて、うち30人を正しく陽性と判定できますが、その666倍となる2万人が偽陽性になります(注:3/15に John Doe さんからのコメントにて計算ミスを訂正)。その2万人が、病院に押し寄せて「症状はないけど検査で陽性って出てしまって不安だから何とかしてくれ」と懇願したらどうなるでしょうか?
とんでもないことになります。医療崩壊という表現が適切でしょう。
99.9%の確率で間違えてしまう「検査」とはなんぞや。
気まぐれにランダムに多くの検査をしてはいけないのです。感染症の専門家が「必要以上の検査はしてはいけない」と、われわれ一般市民の直感に反することを言うのはこれが理由なのです。
検査を行う上で決定的に重要なのは、検査対象の事前確率(有病率)を高めることです。
つまり濃厚接触の経験があったり、発熱が長く続いたり、空咳があったり、これはもうコロナに感染しているでは?と条件が揃って事前確率(有病率)をしっかり高めておいてから、はじめて検査を行うものなのです。
ちなみに、おそらく孫さんが参考にしたと思われるビル・ゲイツの家庭検査キットは、「シアトルという米国でもっとも人口あたりの感染者が増えている地域で」「オンライン診断で行動履歴や接触歴などをしっかり確認」することで事前確率を上げています。これこそが陽性適中率を高める上では欠かせない大前提なのです。
ゲイツ財団の支援プロジェクトがシアトルで新型コロナ用家庭検査キット提供へ | TechCrunch Japan
検査したくても検査してもらえない人が多数いると聞いて発案したけど、評判悪いから、やめようかなぁ。。。
— 孫正義 (@masason) March 11, 2020
孫さん、朝令暮改の素晴らしいご判断と思います。
現在の日本の防疫は他国と比べて成功しており、問題はすでに次の段階に移行しています。これから緊急かつ長期で必要になるのはマスク、消毒用アルコールなどの基本的な医療資源です。
ぜひ、そちらに「やりましょう!」をお願いしたいですね。
検査のしすぎは良くない、という話は、過去にも何度かしてきています。ぜひこちらもご覧ください。
- ガンを早期に発見して治療したり、予防するために知っておくべきことは何ですか?に対するKenn Ejimaさんの回答
- 今年のインフルエンザは過去最高ですか?に対するKenn Ejimaさんの回答
- 学校の友人が微熱、ひどい咳、頭痛、吐き気があり病院で検査をしたのですがインフルエンザ陰性でした。数日経っても良くならず計3回検査をしたのですが全て陰性でした。症状から考えるとインフルエンザだと思うのですが、検査で陰性でもインフルエンザと言うことはあり得ますか?に対するKenn Ejimaさんの回答
また、「事前確率」「事後確率」というのは、主にベイズ理論で扱われる概念です。この概念自体をわかりやすく解説されているSekiguchiさんのこちらの回答もためになります。
3/15追記:
Ko Inagaki さんにこの回答を英語版に翻訳していただきました!