2017.06.22 | ニュース

本当に膵臓がんを検索履歴から見つけて命を救えるのか

ドイツ研究者の意見

本当に膵臓がんを検索履歴から見つけて命を救えるのかの写真

医学は進歩していると思いますか? 確かに最近も多くの進歩があり、実際に多くの人を助けています。しかし、どんな進歩があったかを正しく理解するのは簡単ではありません。数字を誤解すると、過大な期待を抱いてしまうかもしれません。

ドイツのマックス・プランク人間発達研究所のゲルト・ギゲレンツァー氏が、『BMJ Opinion』に寄稿したエッセイで、ビッグデータ解析が医療の現場に役立つかを示すうえで、誤解を招く統計を減らすとともに、透明性を志向することを訴えました。

ギゲレンツァー氏は、2016年にマイクロソフトリサーチの研究者が報告した、ウェブ検索履歴から膵臓腺がん無制限に増殖して周囲へ広がる、異常な細胞(がん細胞)による病気。塊となって腫瘍を作る固形がんと、白血病のように血液中にがん細胞が存在する血液がんがあるを予測しようとする研究を主な話題にしています。

この研究は、マイクロソフト社の検索エンジン「Bing」の使用履歴を解析して、検索履歴から膵臓腺がんを予測することの可能性を探ったものです。研究者は解析したデータの中から、検索語を根拠に、最近膵臓腺がんと診断されたと思われる人を選び出しました。次に、該当者の検索履歴をさかのぼって、関係する可能性がある症状を指す言葉が検索されたパターンを調べました。その結果、検索履歴をもとに、将来膵臓腺がんの診断を示すと思われる語句が検索されることを予測できたとしています。

論文として医学誌『Journal of Oncology Practice』に掲載された報告では、「我々は偽陽性病気をもっていないにもかかわらず、検査の結果が陽性(病気がある)と、誤って判定されること率をきわめて低く維持しつつ(0.00001-0.0001)、症例の5%から15%を特定することができる」とされています。また「このスクリーニング病気の原因や程度ではなく、病気が有るか無いかをまず調べるための検査性能は5年生存率診断、治療開始から5年経過後に生存している患者の割合。命に関わるがんなどの病気で用いられることが多い数値を増加させるかもしれない」とされています。

偽陽性とは、実際には膵臓腺がんではないのに予測では陽性(膵臓腺がんの疑い)の結果を出してしまうことです。スクリーニングとは隠れた病気を見つけ出そうとする検査などを指します。

 

ギゲレンツァー氏は「マイクロソフトの研究者が、低コストで広い範囲をカバーでき、間違った警報をほとんど出すことなく命を救う監視システムを発見したように見える」と受け取っています。そのうえで、この説明が誤解を招くかもしれない点を指摘しています。

第一に、「リードタイムバイアス」により生存率が高く計算される可能性を挙げています。リードタイムバイアスとは、病気を早く発見すればその分だけ、発見されてからの生存期間・生存率は高く計算されることです。仮に早期発見して何も治療をしなくても、早く発見するだけで死亡までの期間は長くなります。そのため、早期発見によって生存率が高くなったとしても、リードタイムバイアスを差し引かなければ、治療上の効果があったかどうかはわかりません。

第二に、まれな病気を探し出そうとすれば、検査の性能が低くても偽陽性率が低いことはある点を挙げています。例として10万人のうち10人が膵臓がんだと仮定したとき、11人に陽性の結果が出され、11人のうち1人が本当に膵臓がんだった場合、偽陽性は10万人中10人、すなわち偽陽性率0.0001となります。

ギゲレンツァー氏は「応えて言うなら、ビッグデータ解析の臨床的有用性を示すための第一歩が目指すべき方向は、透明性と、誤解を招く統計を減らすことだ」と記しています。

 

ギゲレンツァー氏の意見は、数値が誤解を招かないようにすることを求めたものです。

エッセイで挙げられた例のほかにも、生存率や検査の性能についての数値は注意して理解するべき場面がたくさんあります。

たとえばギゲレンツァー氏の議論では「偽陽性率」が問題とされています。検査の性能は普通、「感度検査がどれぐらい信頼できるかを示す指標の1つ。探したい病気がある人のうち、それが検査で見つかる人の割合」と「特異度検査がどれぐらい信頼できるかを示す指標の1つ。調べたい病気にかかっていない人のうち、検査で正しく「病気がない」と判断される人の割合」のセットで表現します。

感度とは病気がある人のうち検査陽性となる割合のことです。特異度とは、病気がない人のうち検査陰性となる割合のことです。

感度と特異度が両方高い検査が優れた検査です。どちらか一方では性能は測れません。たとえば特異度を無視すれば、検査を受けた人全員を陽性とすることで、どんな検査でも感度100%とすることができます。逆に全員を陰性とすればどんな検査でも特異度100%となります。

報道で「精度」などとして数字がひとつしか載っていないようなものは、その数字が何を指すかに注意が必要です。

リードタイムバイアスも注意が必要な要素です。「5年生存率が増加する」ということは必ずしも「治療効果が増す」という意味ではありません。

また、既存の方法と比較することも大切です。仮に「腹痛」を検索したことから将来の病気を予測しようとしたとして、それが腹痛を感じたときに医師の診察を受けることよりも役に立つかどうかは別に考える必要があります。たとえば「うつ症状がある人の80%を正しく指摘できた」という検査があったとして、その検査が本人から症状を聞き出すよりも役に立つかどうかは吟味するべきです。

高度な技術は何でもできそうに思えてしまうものですが、本当の価値を見抜いて役立てるには、事実に基づいて効果を評価する必要があります。ギゲレンツァー氏の意見はあくまで個人の意見としても、数字を独り歩きさせないように伝える良識は、社会全体から求められているのではないでしょうか。

執筆者

大脇 幸志郎


参考文献

Gerd Gigerenzer: Can search engine data save lives from pancreatic cancer?

BMJ Opinion. 2017 June 6.

http://blogs.bmj.com/bmj/2017/06/06/gerd-gigerenzer-can-search-engine-data-save-lives-from-pancreatic-cancer/

※本ページの記事は、医療・医学に関する理解・知識を深めるためのものであり、特定の治療法・医学的見解を支持・推奨するものではありません。 [執筆者一覧]