2015.09.01 | コラム

その薬、本当に効いたんですか?〔論文の読み方シリーズ〕

「有意」は「意味がある」という意味ではない!

その薬、本当に効いたんですか?〔論文の読み方シリーズ〕の写真

薬が効くか効かないかは、実際に使ったときと使わなかったときを比べて調べます。しかし、効いたように見える結果がたまたま出ることもあります。どうなっていれば「効いた」と言えるのでしょうか。

◆たまたまではないことをどうやって確かめるのか

飲んだ、治った。飲まなかった、治らなかった。どれぐらいの違いがあれば、「たまたま治ったのではなく、薬が効いている」と言えるのでしょうか。

Aさんは熱が出たので「ネツサメール」という薬を飲んで寝ました。熱が下がりました。Bさんも熱が出ましたが、薬は飲まないで寝ました。熱は下がりません。ネツサメールは効いたのでしょうか。

たまたまかもしれませんね。では熱が出た人10人のうち5人は「ネツサメール」を飲み、5人は飲まなかったとします。こんな結果が出ました。

  治った 治らなかった
飲んだ 5 0
飲まなかった 2 3

飲んだ人は5人全員が治り、飲まなかった人は5人中2人しか治りませんでした。どうでしょう?飲んだ人が全員治ったなら、まあ飲んでおこうかな、と思うかもしれませんが、統計的には「たまたまかもしれない」という範囲です。もう少し差が出ないと「たまたまではなさそうだ」とは言えないのです。たとえばこれぐらい。

  治った 治らなかった
飲んだ 5 0
飲まなかった 1 4

これなら統計的に「たまたまではなさそうだ」と言えます。けっこう極端ですね。もし同じ割合でほかの人にも効き続けるのだとすると、500人が飲んだらこうなります。

  治った 治らなかった
飲んだ 500 0
飲まなかった 100 400

治らなかった400人がむしろかわいそうに思えてきます。ネツサメールを飲めば治るのに。

でも、現実に使われているのは、こんなに効く薬だけではありません。なぜでしょうか。ズルをしているのでしょうか。

 

◆「たまたまではない」は2方向から

上の話で出てきた「たまたまではなさそうだ」ということを、統計学の用語で「有意」と言います。「たまたまではない」ではなく「なさそうだ」と言っているのは、偶然と必然の区別はどこまで行っても程度の問題で、はっきりした境界はないからです。

けれども境界を引かないと薬が効くか効かないかも決められないので、医学研究の世界では誰が決めたともなくいつのまにか、「5%」が多くの場合の基準として使われています。たまたまだったとすると5%未満の確率でしか起こらないことは、たまたまではなさそうだと判断しよう、ということです。

サイコロで「6が出るぞ」と言って6が出てもたまたまかもしれませんが、2回続けて「6が出るぞ」と言って6が出る確率は1/36=2.8%ぐらいですから、「サイコロに仕掛けがあるのかもしれない」などと考えることになります。

さっきの表で言うと、

  治った 治らなかった
飲んだ 5 0
飲まなかった 1 4

たまたまこうなる確率は2.4%ぐらいです(Fisher's exact testという方法で計算します。ほかにも無数の計算方法があり、データの性質によって細かく使い分けないといけないのですが、その説明は省きます)。5%より小さいので、「ネツサメールの有意な効果が見られた」と言えます。効果が大きければ有意な結果が出やすいことが想像できると思います。

効果が大きい以外に、どんなときに有意な結果が出るのでしょうか。ネツサガールという薬でこんな数字が出たとします。

  治った 治らなかった
飲んだ 270 230
飲まなかった 230 270

ネツサメールほど極端に効くわけではなさそうですが、やはり計算するとたまたまこうなる確率は5%未満になり、「いくらかは効くらしい」と判断することになります。ネツサメールのときに

  治った 治らなかった
飲んだ 5 0
飲まなかった 2 3

こうなっても「たまたまかもしれない」(有意ではない)という判断だったのと、違いは何でしょうか。

それは研究に参加した人数が多いということです。大きな違いがなくても、大勢で調べた結果なら、たまたまではなさそうだと言えることがあります。

 

◆「有意」は「意味がある」という意味ではない!

ネツサメールは効果が大きいので、少人数の研究でも有意な効果が見られました。ネツサガールは効果が小さいですが、大人数の研究で調べたので有意な効果が見られました。どちらも「有意」、つまり「たまたまではなさそうだ」と言っていますが、「どちらの薬にも意味がある」ということではありません

もしネツサメールとネツサガールがどちらも同じ病気に使う、同じように熱を下げる薬で、副作用も気にしなくていいとすれば、実際に使われるのはどちらでしょうか。

ネツサメールですよね。

それでも、ネツサメールの研究で1人が違う結果になっていれば、計算結果は「有意ではない」となっていたかもしれません。だからといってネツサメールが「効かないとわかった」のではなく「効くという証拠が得られなかった」と言うのが正確です。

逆にネツサガールは効くらしいという証拠が得られましたが、「証拠がある」ということと「よく効く」ということは違います。ネツサガールよりももっと微妙にしか効かない薬でも、もっと大人数の研究をすれば、有意な結果は出るのです。薬ではないサプリメントや普通の食べ物でも、何万人という人数で調べれば、血圧や血糖値に有意な効果が見つかるかもしれません。

どれぐらい効くのか、何に効くのか、効かせるためにどんなコストがかかるのか、といった面を考えあわせなければ、いい薬かどうかは決められません。そうした文脈の中で初めて、統計によって有意と言えるかどうかが、意味を持ってきます。

執筆者

大脇 幸志郎

※本ページの記事は、医療・医学に関する理解・知識を深めるためのものであり、特定の治療法・医学的見解を支持・推奨するものではありません。

▲ ページトップに戻る