El librero la Fontana・ホンタナ氏の本棚

人生の最後を一番美しく過ごすのは、いつの日か、田舎、といっても町からあまり離れていないところに隠居し、今までに愛読した何冊かの本を、もう一度、書き込みなどしながら読み返すことだ。           (アンドレ・モーロワ「私の生活技術」より)

ブックガイド(58)身長は正規分布、では体重は?

――身長は正規分布、では体重は?――

 

気楽に読める一般向けの本で、アンダーライティングに役立つ最新知識をゲットしよう。そんなコンセプトでブックガイドしております、査定歴22年の自称査定職人ドクター・ホンタナ(ペンネーム)です。今回のテーマは「統計分布」。タイトルが「統計分布を知れば世界が分かる」、サブタイトルが「身長・体重から格差問題まで」ですからアンダーライティングを仕事にしているからには読まずにはいられません。

 データをグラフ化した場合、身長やテストの成績は皆さんご存じの「正規分布」(例の釣鐘型のカーブ:上に示した本の表紙にある右のカーブ)になります。平均値周辺が多くそこから離れれば離れるほど左右均等に少数になっていきます。一方、地震のエネルギーと頻度の関係は急激な右肩下がりのカーブで示される「べき状分布」になることがわかっています。小さな地震は日常的に起きますがエネルギー(マグニチュードなどと言いますね)が大きな巨大地震は数百年に一度。これをグラフに表すと地震が大きくなればなるほど頻度は指数関数的に減少するということです(本の表紙の真ん中、下のカーブ)。

 では体重はどうでしょう。一見、正規分布のように思えますが過体重(つまり太りすぎ)のゾーンでは数は少ないですが正規分布におさまらないほどの体重の人がいるため、グラフは正規分布のカーブの右側が流れたような形になります(本の表紙図の左上のカーブ)。このカーブ、横軸を対数目盛にすると正規分布の形になるので「対数正規分布」と呼びます。

 この対数正規分布、つまり平均的な値があり大多数は平均値周辺に分布するけれども例外的に巨大な値をとるものが出現する・・というような分布は人間社会によく見られます。例えば、横軸に市町村の人口ランク、縦軸にそのランクに入る市町村数をプロットすると大多数の市町村は正規分布に従うように見えながら東京・大阪・名古屋などの大都市は正規分布を逸脱し対数正規分布になります。また、世界の国のGDPの金額ランクを横軸にそのランクに入る国の数を縦軸にプロットすると超大国があるために対数正規分布になります。(注:このように測定値ランクを横軸にとり縦軸にそのランクに入る対象の数をプロットする手法をランキング・プロットと呼びます)そう考えてくると、確かに対数正規分布によって正規分布的な一般集団とそれを逸脱したスーパーリッチの出現がうまく表現されているように見えます。

 ではなぜそうなるのか?著者によれば、身長やテストの点数のようないろいろな要因がそれぞれバラバラで足し算的に影響する、いわば加算過程(確率の足し算)の統計分布は正規分布となる。一方、現実社会はある要素が次の要素に影響しさらにその影響が次の要素に影響するという具合に加算過程というよりは乗算過程(確率の掛算)でありその統計分布は、対数をとることで初めて加算過程に変換できるというわけです。それを踏まえて、著者は対数正規分布こそが人間社会のような複雑系の統計的表現であると結論付けたいようです。大まかには合っているように思えますが、話の展開はやや情緒的な飛躍があり、最後まで読んでも「理論があっての現実解釈」なのか「現実があってそれを説明しうる理論づくり」なのか混沌としています。さらに先にすすもうとwebで対数正規分布を検索してみましたが難しい数式世界になってしまい、ちょっと難しそうです(参考URL)。

 現時点では、この本で「世の中、正規分布だけではおさまらない」ことを知るだけでも結構おもしろいですよ。それとランキング・プロット法も保険医学で使えそうな気がします。(査定職人 ホンタナ Dr. Fontana 2019年11月)

<参考URL>

新入社員の時に同じだった年収が次第にバラけていく様子から対数正規分布を学ぶ
https://rikunora.hatenablog.com/entry/20100418/p1
 

理経済学における「富の分布理論」
https://rikunora.hatenablog.com/entry/20170321/p1