検索履歴で膵臓がんがわかる?
ドイツのマックス・プランク人間発達研究所のゲルト・ギゲレンツァー氏が、『BMJ Opinion』に寄稿したエッセイで、ビッグデータ解析が医療の現場に役立つかを示すうえで、誤解を招く統計を減らすとともに、透明性を志向することを訴えました。
ギゲレンツァー氏は、2016年にマイクロソフトリサーチの研究者が報告した、ウェブ検索履歴から膵臓腺がんを予測しようとする研究を主な話題にしています。
この研究は、マイクロソフト社の検索エンジン「Bing」の使用履歴を解析して、検索履歴から膵臓腺がんを予測することの可能性を探ったものです。研究者は解析したデータの中から、検索語を根拠に、最近膵臓腺がんと診断されたと思われる人を選び出しました。次に、該当者の検索履歴をさかのぼって、関係する可能性がある症状を指す言葉が検索されたパターンを調べました。その結果、検索履歴をもとに、将来膵臓腺がんの診断を示すと思われる語句が検索されることを予測できたとしています。
論文として医学誌『Journal of Oncology Practice』に掲載された報告では、「我々は偽陽性率をきわめて低く維持しつつ(0.00001-0.0001)、症例の5%から15%を特定することができる」とされています。また「このスクリーニング性能は5年生存率を増加させるかもしれない」とされています。
偽陽性とは、実際には膵臓腺がんではないのに予測では陽性(膵臓腺がんの疑い)の結果を出してしまうことです。スクリーニングとは隠れた病気を見つけ出そうとする検査などを指します。
本当に間違いなく命を救えるのか?
ギゲレンツァー氏は「マイクロソフトの研究者が、低コストで広い範囲をカバーでき、間違った警報をほとんど出すことなく命を救う監視システムを発見したように見える」と受け取っています。そのうえで、この説明が誤解を招くかもしれない点を指摘しています。
第一に、「リードタイムバイアス」により生存率が高く計算される可能性を挙げています。リードタイムバイアスとは、病気を早く発見すればその分だけ、発見されてからの生存期間・生存率は高く計算されることです。仮に早期発見して何も治療をしなくても、早く発見するだけで死亡までの期間は長くなります。そのため、早期発見によって生存率が高くなったとしても、リードタイムバイアスを差し引かなければ、治療上の効果があったかどうかはわかりません。
第二に、まれな病気を探し出そうとすれば、検査の性能が低くても偽陽性率が低いことはある点を挙げています。例として10万人のうち10人が膵臓がんだと仮定したとき、11人に陽性の結果が出され、11人のうち1人が本当に膵臓がんだった場合、偽陽性は10万人中10人、すなわち偽陽性率0.0001となります。
ギゲレンツァー氏は「応えて言うなら、ビッグデータ解析の臨床的有用性を示すための第一歩が目指すべき方向は、透明性と、誤解を招く統計を減らすことだ」と記しています。
統計が誤解を招く?
ギゲレンツァー氏の意見は、数値が誤解を招かないようにすることを求めたものです。
エッセイで挙げられた例のほかにも、生存率や検査の性能についての数値は注意して理解するべき場面がたくさんあります。
たとえばギゲレンツァー氏の議論では「偽陽性率」が問題とされています。検査の性能は普通、「感度」と「特異度」のセットで表現します。
感度とは病気がある人のうち検査陽性となる割合のことです。特異度とは、病気がない人のうち検査陰性となる割合のことです。
感度と特異度が両方高い検査が優れた検査です。どちらか一方では性能は測れません。たとえば特異度を無視すれば、検査を受けた人全員を陽性とすることで、どんな検査でも感度100%とすることができます。逆に全員を陰性とすればどんな検査でも特異度100%となります。
報道で「精度」などとして数字がひとつしか載っていないようなものは、その数字が何を指すかに注意が必要です。
リードタイムバイアスも注意が必要な要素です。「5年生存率が増加する」ということは必ずしも「治療効果が増す」という意味ではありません。
また、既存の方法と比較することも大切です。仮に「腹痛」を検索したことから将来の病気を予測しようとしたとして、それが腹痛を感じたときに医師の診察を受けることよりも役に立つかどうかは別に考える必要があります。たとえば「うつ症状がある人の80%を正しく指摘できた」という検査があったとして、その検査が本人から症状を聞き出すよりも役に立つかどうかは吟味するべきです。
高度な技術は何でもできそうに思えてしまうものですが、本当の価値を見抜いて役立てるには、事実に基づいて効果を評価する必要があります。ギゲレンツァー氏の意見はあくまで個人の意見としても、数字を独り歩きさせないように伝える良識は、社会全体から求められているのではないでしょうか。
執筆者
Gerd Gigerenzer: Can search engine data save lives from pancreatic cancer?
BMJ Opinion. 2017 June 6.
http://blogs.bmj.com/bmj/2017/06/06/gerd-gigerenzer-can-search-engine-data-save-lives-from-pancreatic-cancer/※本ページの記事は、医療・医学に関する理解・知識を深めるためのものであり、特定の治療法・医学的見解を支持・推奨するものではありません。