El librero la Fontana・ホンタナ氏の本棚

人生の最後を一番美しく過ごすのは、いつの日か、田舎、といっても町からあまり離れていないところに隠居し、今までに愛読した何冊かの本を、もう一度、書き込みなどしながら読み返すことだ。           (アンドレ・モーロワ「私の生活技術」より)

続・私の本棚 (5)RCTでChoosing Wisely!

還暦過ぎの元外科医ホンタナが、医学知識のアップデートに役立つ一般向け書籍をセレクトし、テーマごとに同世代の医師に紹介するブックレビューのセカンドシーズン「続私の本棚・還暦すぎたら一般書で最新医学」です。

第5回のテーマは「統計学」です。還暦世代にとっては統計といえば、論文を書くときのデータの有意差検定などがなじみ深いですよね。

こうした検定統計学はもちろん現在でも大切なのですが、今回は医療の現場で意思決定のツールとして使われているRCT (Randomized Controlled Trials=ランダム化比較試験)を中心に、最近の統計学のあれこれを読みときたいと思います。

医療現場でも身近なRCT

医学・医療の分野では20世紀の終わりに、根拠にもとづく医療EBM(Evidence Based Medicine)という考え方が出現しました。いわば医師の直感に頼るのではなく、きちんとしたデータ・証拠をもとに意思決定をやっていこうというものです。

そのEBMの考え方の中で最も有効なツールと考えられているのがRCTです。例えば乳がん検診を例にとると、無症状の40代女性100人を無作為に50人ずつの2つのグループに分けて、一方にはマンモグラフィーによる乳がん健診を行い、片方には行わないという操作を加えたとき、そのアウトカム(例えば診断率や生存予後)はどちらがいいのか、というようなRCT研究が大規模に行われるようになっています。

わが国でも、それらの研究成果をエビデンスとして乳がん検診のガイドラインが作られています。「RCT→エビデンス→ガイドライン」という流れが、医療における意思決定の流れとして定着しているのです。

「21世紀の意思決定にはRCT」
――そんなことを感じさせる1冊

1冊目の本は、そのものずばり「RCT大全」です。まずは医療におけるRCT例が多数紹介されています。最近まで医学の常識と思われていたことがRCTで覆されることも多いようです。

例えば膝の半月板の損傷において、関節鏡で本当に手術するグループと皮膚に傷だけつける偽手術のグループでRCTをしたところ、症状の軽減に差はなかったという驚くべき結果も出ています。

医療にとどまりません。21世紀になって、そのRCTが医療に限らず社会のさまざまな分野における意思決定に使われるようになってきました。つまり社会のあらゆる意思決定の場面で、大きく何かを変える前に、小規模なRCTを実施して予測するというプロセスが実行されるようになってきたのです。

これまで政治にせよ企業活動にせよ、意思決定は究極的にはボスの直感で決めることが多かったですよね。これを「HiPPO(ヒッポ)=Highest Paid Person's Opinion(最も高い給料をもらっている人の意見(鶴の一声)」とよぶそうです。

で、この鶴の一声、ご存じのように往々にして間違うんです。変化の激しい社会では、ボスが経験と勘に頼って判断を下せば、致命的な、目的とは真逆の結果をもたらしかねません。

本書にある失敗例では、放課後プログラム(学童保育のようなもの)はアメリカでは逆に悪い仲間とつるみやすくなり、犯罪率が上昇しました。また、ユヌス氏がノーベル平和賞を受賞したマイクロ・クレジット(少額融資制度)も高利貸しの被害者を増やす結果に、衛生改善のため町中にトイレを増やしても汚いスポットを増やすだけ…といった具合です。

「人間は、いい話・よくできたストーリーに弱い」けれど、現実はストーリー通りにすすまないのです。ボスが自分好みのストーリーに沿って理屈で考えたものが予想外の結果に終わってしまう。そこで二者択一、「やるかやらないか」「AかBか」の判断にRCTをやってみようというわけです。

本書にはそうしたRCTの事例が網羅的に収録されています。最も多いのが政策です。教育・就労支援・犯罪制御・衛生改善など。国が限られた予算の中でAをやるかBをやるかという時には、小規模のRCTであたりをつけることがいかに重要かよくわかります。

目下のところ、医療以外でRCTを日常的に取り入れているのがインターネット関連業界です。データを取りやすいこともありネットはRCTであふれています。Amazonで値段が猫の目のように変わるのも価格変動RCTなんですよね。

一方で、政治でも企業の経営判断でも日本的な根回し+鶴の一声で大失敗という例も数々見てきました。特に従来型の大企業ではなかなかRCTをうまくつかいこなせていないんじゃないでしょうか。まだまだ演繹的なストーリー中心主義が幅をきかせています。

例えば、細かいことにコストかけてやったほうがいいのか、コストかけない大雑把なやりかたとどちらがいいのかなんて、議論してもわからないことはRCTをやってみるとあっさりと結果がでることが多いのです。エミネンス(Eminence=鶴の一声)の時代から エビデンスの時代に。21世紀の意思決定にはRCTで…そんな1冊です。

相関関係≠因果関係
――勘違いしやすい相関関係、証明するには?

2冊目は「データ分析の力 因果関係に迫る思考法」。帯に「ビッグデータ+人間の判断力=真実が明らかに!」と書かれています。

1冊目の「RCT大全」で、RCTによってエビデンスを得て意思決定するという話をしました。しかしエビデンスを解釈する際に大きな問題となってくるのが「相関関係を因果関係と勘違いしてしまう」という誤謬(ごびゅう)です。

例えば、喫煙者には肝機能異常者が多い(=相関関係がある)、よってタバコは肝臓に良くない、というのが典型です。これは、タバコを吸う人には酒を飲む人も多いため、飲酒により肝機能異常者が多いわけです。この場合の飲酒を交絡因子とよびます。

実際の企業の現場でも「去年の夏はテレビCMでアイスの売り上げが伸びたから今年もやろう」という一見正論っぽい話(実は去年は猛暑だっただけ)が相関関係と因果関係をゴチャゴチャにしており、そうした誤謬をもとになされている意思決定は多いのです。

そこで、相関関係ではなく因果関係を証明するにはどうすればいいのかというのが本書のテーマになります。

本書からわかりやすい例をあげますと、オバマ元大統領が選挙戦用のホームページデザインを決定する際、何パターンか作ってネットでの訪問者に各パターンをランダムに割り振り、どのパターンがもっとも寄付につながるのかという実証分析の結果を経てデザインを選択したというのが典型的です。これってまさにRCTですが、それが社会科学でも使われるようになってきたというわけです。

しかし医療と違って、実際の社会現象を将来にむかって二つのグループにわけることはむずかしいので、RCTは多くの場合不可能です。そこで登場するのがRCTの代わりとなりうる種々の方法です。

本書では「境界線を賢く使うRDデザイン」「階段状の変化を賢く使う集積分析」「複数期間のデータを生かすパネル・データ分析」などがとりあげられています。

例えばRDデザインでは、「自動車にかかる税率が自動車の重量に応じて階段状に変化する場合、税率が高くなる重量のぎりぎり内側の重量の自動車が増えてくる」などということが実際にあるので、税率の境界線前後のグループを比較することができます。

それにより、より燃費のよいクリーンな自動車を増やすには税率をどうすればよいかということがわかるのです。分野としては「計量経済学」というらしいです。新書とは思えない懇切丁寧さできちんと説明されていて、わかりやすい良書になっています。

身長は正規分布、では体重は?

3冊目の統計本はRCTからは少しはずれますが、「統計分布を知れば世界が分かる」。サブタイトルが「身長・体重から格差問題まで」なので、健康問題とも無関係ではなさそうです。

データをグラフ化した場合、身長やテストの成績は皆さんご存じの「正規分布」になります。平均値周辺が多く、そこから離れれば離れるほど左右均等に少数となっていきます。一方、地震のエネルギーと頻度の関係は急激な右肩下がりのカーブで示される「べき乗分布」になることがわかっています。

小さな地震は日常的に起きますが、エネルギー(マグニチュードなどと言いますね)が大きな巨大地震は数百年に一度。これをグラフに表すと、地震が大きくなればなるほど頻度は指数関数的に減少するということです。

では体重はどうでしょう。一見、正規分布のように思えますが、過体重(つまり太りすぎ)のゾーンでは数は少ない一方、正規分布におさまらないほどの体重の人がいるため、グラフは正規分布のカーブの右側が流れたような形になります。このカーブ、横軸を対数目盛にすると正規分布の形になるので「対数正規分布」と呼びます。

この対数正規分布、つまり、平均的な値があり大多数は平均値周辺に分布するけれども例外的に巨大な値をとるものが出現する…というような分布は人間社会によく見られます。

例えば横軸に市町村の人口ランク、縦軸にそのランクに入る市町村数をプロットすると、大多数の市町村は正規分布に従うように見えながら東京・大阪・名古屋などの大都市は正規分布を逸脱し、対数正規分布になります。

また、世界各国のGDPの金額ランクを横軸に、そのランクに入る国の数を縦軸にプロットすると、超大国があるために対数正規分布になります。(注:このように測定値ランクを横軸にとり縦軸にそのランクに入る対象の数をプロットする手法をランキング・プロットと呼びます)

そう考えてくると、確かに対数正規分布によって正規分布的な一般集団とそれを逸脱したスーパーリッチの出現がうまく表現されているように見えます。

ではなぜそうなるのか? 著者によれば、身長やテストの点数のようないろいろな要因がそれぞれバラバラで足し算的に影響する、いわば加算過程(確率の足し算)の統計分布は正規分布となる。

一方で現実社会は、ある要素が次の要素に影響しさらにその影響が次の要素に影響するという具合に、加算過程というよりは乗算過程(確率の掛算)であり、その統計分布は対数をとることで初めて加算過程に変換できるというわけです。

それを踏まえて、著者は対数正規分布こそが人間社会のような複雑系の統計的表現であると結論付けたいようです。大まかには合っているように思えますが、話の展開はやや情緒的な飛躍があり、最後まで読んでも「理論があっての現実解釈」なのか「現実があってそれを説明しうる理論づくり」なのかはやや混沌としています。

さらに先へすすもうとwebで対数正規分布を検索してみました(下記1、2)が、難しい数式世界になってしまい、ちょっと手強そうです。

 1:新入社員の時に同じだった年収が次第にバラけていく様子から対数正規分布を学ぶ
 2:物理経済学における「富の分布理論

ここまで勉強しなくてもこの本で「世の中、正規分布だけでは収まらない」ことを知るだけでも結構おもしろいと思います。

医療の「やってはいけない」もRCTで

統計をテーマにした一般書から、RCTが一般化しつつある状況を見てきました。医療においては、そんな中で誕生したのが「Choosing Wisely(賢明なる選択)」という活動です。アメリカの医学会連合が2011年に始めたこの活動は欧米で急速に広まっています。

その中心となるのは各学会が出している「Don’t……」形式のリスト、つまり「こんなことはしないほうがマシ」というリストです。このリストがなかなかおもしろい。これまでの医療に対する強力なアンチ・テーゼでもあり、自分が臨床時代に教えられるままにやってきた医療がにべもなく否定されることには爽快感さえ感じます。

例えば、American College of Physiciansの出している「Choosing Wisely」リスト5項目を訳すと次のようになります。

 1:無症状で冠動脈疾患リスクが低い人にスクリーニング目的で負荷心電図をやってはいけない。
 2:特別な神経学的症候のない一般的な腰痛患者に画像検査をやってはいけない。
 3:一回だけの失神歴で神経学的に異常がない患者に脳の画像診断をやってはいけない。
 4:深部静脈血栓症疑いの場合、まずD-dimerを測定すべきであり造影などの画像検査は診断のためにやってはいけない。
 5:術前の一般検査として胸部症状のない患者の胸部レントゲン検査をやってはいけない。

これらが、すべてRCTに基づいて提言されているのです。ここで「やってはいけない」と言われていることを日常診療でやってしまうことは、その検査自体が無駄でもあるし、その結果得られる所見があいまいであったり、偽陽性であったりするため、さらに精密検査など無駄な医療を産み出すのです。

なるほど、EBMはこういう方向にも展開しているのかと実感しました。これまで科学技術の発展に合わせるように、医療も「やれることはできるだけやる」という足し算主義でやってきましたが、「Choosing Wisely」は言わば引き算主義、つまり「過ぎたるはなお及ばざるがごとし」ということです。

足し算主義の時代を生きてきた還暦世代にはなかなか難しいという気もします。しかし世間で断捨離がブームであるのをみても、引き算主義の考え方も必要でしょうね。

次回予告

さて次回のテーマは「最近の免疫学」です。急激に発展する免疫学は還暦世代にとってもっとも難解な分野です。そんな免疫学の最新情報を「休み時間の免疫学」・「免疫の守護者 制御性T細胞とはなにか」・「がんを瞬時に破壊する 光免疫療法」の3冊を読み解いてみたいと思います。

次回もご期待ください。