問題は、「検査の精度」だけじゃない。「スクリーニング検査」としての有効性を問う視点


山田:はい。第一の問題は、「そもそも企業が報告している検査の再現性や精度が、報告されているものよりも低いのではないか」という疑義が、外部の医師、内部からのリーク、メディアからの指摘によって生じている、という点です。

編集:その一つめの問題は、記事などでなんとなく理解していました!

山田: 続いて第二の問題は、「スクリーニング検査」としての有効性が不明である、という点です。「スクリーニング検査」として有効であると判断できない場合、企業が報告している検査の精度が仮に正しい場合でも、医師としてこの検査を推奨することはありません。

編集:「検査の精度」にばかり気を取られていましたが、「スクリーニング検査」って何ですか?

山田:病気などの症状がない人が受ける検査を、「スクリーニング検査」と言います。目的は、病気の見逃しを防ぐこと。この「スクリーニング検査」は、本当は病気があるのに「陰性」と出てしまう「偽陰性」と呼ばれる結果の割合が、少ない検査が望ましいんです。

編集:なるほど。「その検査が病気の見逃しが少ないかどうか」を、ちゃんと調べないといけないんですね。

山田:そうなんです。そしてそれを調べるためには、実際にがんがある人たちにこの検査をしてもらいます。その結果、きちんと陽性が出る確率が高い検査が「感度が高い検査」です。なお、がんがないと分かっている人たちにこの検査をして、陰性が出る確率は「特異度」と呼ばれ、この感度と特異度が「検査の精度」を構成する指標になります。

編集:初めて知りました。

山田:ただし、ここで注意が必要です。私たちは、「病気かどうか分からないから」検査をしますよね。でも「検査の精度」というのは、私たちが検査を受ける時とは逆の方向で規定されるんです。ここに落とし穴があります。では、はたして「感度の高い検査」であれば、多くの方にその検査を勧めてよいのか? という点について、数字とたとえ話を用いて説明していきますね。

編集:お願いします!

山田:たとえば、99%の確率で陽性と出る、とても感度が高い検査があるとします。CMなどでその検査を知った、「30代で」「症状がなく」「家族にもがんの既往歴のない」健康な男性10万人がその検査を受け、この中で、本当にがんがある人が、仮に100人いたとしましょう。

この場合、この検査の恩恵を受けるのは、本当にがんであった100人のうち、99人です。
一方で、99900人は、がんでないにも関わらず検査を受けることになります。

しかもその99900人の方の中には、がんではないのにがんだと診断されてしまう人、いわゆる「偽陽性」の人が出てきてしまいます。

編集:え……それは困りますね。どれくらいの人数が、がんではないのにがんだと診断される可能性があるのですか?

山田:そこを説明するためには、先にご説明した検査の「特異度」という視点を加えなくてはいけません。仮にこの検査の特異度が90%だとすると、検査を受けた10万人のうち、1万人はがんでないのに陽性、つまり「偽陽性」となってしまうのです。

本当は健康でも、検査で陽性と出て15種類のがんの可能性が示唆されれば、当然全身を調べたくなりますよね。十万円前後するPET検査を、健康であるにも関わらず受ける人を約1万人生むことになります。

編集:本来は不必要な検査でも、がんがないとは本人は知らないのだから、がんの可能性があると言われたら不安になって、やりたくなってしまいますよね……。しかも、完全にがんじゃない、と納得できるまではやめられない気がします。

山田:そうですね。仮にPETが陰性でも、もっと胃がんや大腸がんにとって精度の高い、たとえば胃カメラや大腸カメラも受けて結果を見るまでは気が休まらない、と考える方もいるかもしれません。

こうしてみると、この検査、10万人もの人に行って99人に検査の恩恵があった一方で、1万人に金銭的・精神的な負担、追加検査の合併症などが生じるリスクがあるとしたら……この検査のリスクとベネフィットの天秤が、揺らいできますよね。このように見てみると、検査陽性と出た人が10099人いて、その中でがんがある確率は、99/10099=約1%となりました。「精度の高い検査」と聞いていたと思いますが、陽性でがんを見事に当てる確率は1%になってしまったのです。このように、実は私たちの知りたい確率というのは、「検査の精度」だけでは規定されず、検査を受ける前にその人にがんがある確率に大きく左右されるのです。

このように、いくら感度が99%と精度の非常に高い検査だったとしても、大きな問題が生じ得ます。そして、仮にこの感度が99%よりも低いものであれば、検査としての評価はどうでしょう。この線虫がん検査に関しては、感度が90%にも満たない可能性も指摘されてきているのです。

編集:「検査の感度が高い」だけでは、検査として十分ではない、ということが理解できました。ちなみに、検査の本当の「有効性」ってどうやってわかるのですか?